Dienstag, 23. April 2024, 21:56 UTC+2

Sie sind nicht angemeldet.

  • Anmelden
  • Registrieren

samuel

Überlieferer der Zeit

Registrierungsdatum: 9. Juni 2011

Beiträge: 9 504 Aktivitäts Punkte: 39 125

1

Donnerstag, 29. März 2018, 22:01

Videodatei in Text umwandeln

Hallo ihr lieben,

ich suche ein Programm, mit den man Videodateien in Text umwandeln kann, genauer gesagt die Tonspur natürlich.
Es sollte kostenfrei sein, weil ich es nur für einen einmaligen Zweck benötige.
Hätte auch keine Probleme, die Videodatei vorher in mp3 oder so umzuwandeln, aber daraus wollte ich den gesprochenen Text übernehmen.
hat jemand 'ne Idee?

LG samuel.
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

2

Freitag, 30. März 2018, 01:45

Sorry aber ...


Das ist schlichtweg unmöglich. Jedenfalls für die derzeit zur verfügung stehende Technik!
Man kann allenfalls in Videodateien eingebettete Untertitel per OCR rausfischen. Aber auch das ist mit sehr viel Handarbeit verbunden.

Aber gesprochenes in Text umwandeln und das auch nur ansatzweise in erträglicher Qualität. Dazu sind sogar sauteure Profiwerkzeuge bei denen es primär um das Diktieren von Text geht das in Textform auf dem Bildschirm widergegeben wird, gerade mal mit aktzebtablen ergebnissen fähig. Aber wie gesagt alles mit viel händischer nachbesserung verbunden und nicht machbar ohne vorher die Software Stunden oder Tagelang auf eine bestimmte Stimme zu trainieren.
Ich seh da keine Möglichkeit eine Audiodatei aus einem Film oder sonstwas in Text umzuwandeln.
Der umgekehrte weg dagegen ist sehr woh machbar und sogar mit günstiger oder freier software. Also Text vom Computer vorlesen lassen in Audio. Angenehm klingt das aber selten.

Für dein Vorhaben gibt es nur eine Lösung: Manpower! Also menschliche Arbeitskraft. Such dir ne billige Kraft die das für dich abtippt. Kann man sogar im Netzt für obszön niedrige Stundensätze anheuern bei diversen Anbietern.

Dieser Beitrag wurde bereits 7 mal editiert, zuletzt von »samuelclemens« (30. März 2018, 02:14)

  • Zum Seitenanfang

Ender

Überlieferer der Zeit

Registrierungsdatum: 23. Juni 2010

Beiträge: 5 564 Aktivitäts Punkte: 27 015

Wohnort: Enderversum

3

Freitag, 30. März 2018, 10:02

Vielleicht mal Cortana oder Siri fragen.... :lol:

Ender
Europa ist unser aller Zukunft. Wir haben keine andere.
Hans-Dietrich Genscher
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

4

Freitag, 30. März 2018, 12:17

Vielleicht mal Cortana oder Siri fragen


Du weist nicht wovon du redest mein lieber!
Beides genannte macht nichts anderes als simple, sehr oft eingeübte sprachmuster in simple Comnputerbefehle umzusetzten. Und selbst das mit sehr mäßigem erfolg. Das ist nicht nur meilen sondern lichtjahre von dem entfernt was samuel bezweckt.
Gäbe es eine software die das kann was samuel will wüsste ich das und umsonst schonmal gar nicht.
Samuel will im Grunde eine Diktiersoftware. Selbst die besten und teuersten Anwendungen in diesem Bereich sind mit sysyphusartiger nachbesserung des Textes hinterher verbunden. Nicht umsonst verdingen sich scharen an Schreibräften auf diversen Portalen ihr Tagebrot mit genau solchen Arbeiten wie das abtippen von Diktatbändern ihr Tagebrot.Aber

Unglaublich was Leute heutzutage denken das Computer tun können.

Aber wer weiss, vielleicht macht dir deine Siri noch'n Lapdance wenn du lieb fragst... :rofl:
  • Zum Seitenanfang

Ender

Überlieferer der Zeit

Registrierungsdatum: 23. Juni 2010

Beiträge: 5 564 Aktivitäts Punkte: 27 015

Wohnort: Enderversum

5

Freitag, 30. März 2018, 14:06

Lieber samuekclemens,

ich dachte, es wäre sichtbar, dass mein Kurzkommentar nicht ernst gemeint ist!
Die beiden Softwarefrauen sind bei mir verbannt!!

Ender
Europa ist unser aller Zukunft. Wir haben keine andere.
Hans-Dietrich Genscher
  • Zum Seitenanfang

Eumenes

Torwächter

Registrierungsdatum: 12. November 2008

Beiträge: 2 585 Aktivitäts Punkte: 13 035

Wohnort: Valinor

6

Freitag, 30. März 2018, 14:08

Die beiden Softwarefrauen sind bei mir verbannt!!


Da sind wir mal einer Meinung. :)
Ich brauche keine Abhöreinrichtungen in der Wohnung.
They who can give up essential liberty to obtain a little temporary safety, deserve neither liberty nor safety.
(Benjamin Franklin)
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

7

Freitag, 30. März 2018, 14:22

ich dachte, es wäre sichtbar, dass mein Kurzkommentar nicht ernst gemeint ist!


Sorry, aber ich kanns nicht mehr hören. Samuel ist nicht der erste der mit so einem Wunsch ankam und als Beispiel die ach so fähigen Computertippsen auf dem Niveau eines Grundschülers anführte. Ungefähr so realistisch wie Hoverboards, Jetpacks oder fliegende privat PKWs.
Im prinzip alles nicht technisch unmöglich aber ungefähr so realistisch und machbar wie mit einer Silversterrakete in die Stratosphäre zu gelangen.
Ein bisserl hintergrundwissen was mit technik machbar ist sollte man den Kids heutzutage schon mitgeben um den gesunden menschenverstand nicht vollends zu verlieren.
Es gibt doch tatsächlich leute die sich ernsthaft darüber beschweren dass eine App auf ihrem Smartphone nicht funktioniert die doch die eingebaute LED in nen Laser oder Hologrammprojektor umwandeln kann. :wech:
  • Zum Seitenanfang

Pauly

Lebende Foren Legende

Registrierungsdatum: 27. Oktober 2010

Beiträge: 1 209 Aktivitäts Punkte: 6 225

Wohnort: Schleswig Holstein

8

Freitag, 30. März 2018, 14:29

Moin Samuel

vieleicht hilft Dir das weiter, ist von 2013 https://www.youtube.com/watch?time_continue=4&v=CleLvQWy8-c

Ich habe auf meinen Rechnern kein Google Chrome und konnte es daher nicht testen, ob es jetzt noch funktioniert.
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

9

Freitag, 30. März 2018, 14:59

Na dann versuch erstmal die kostenlose testversion der Google Speech Api ohne angabe deiner Kreditkartendaten zu testen. ;)

Aber sicher, hinter diesen Cloudbasierten Anwendungen stecken sehr leistungsstarke Netzwerke dahinter. Könnte unter umständen tatsächlich ansatzweise brauchbare Ergebnisse liefern. Lässt sich nur leider schwer testen. Da muss ich mein Urteil vielleicht revidieren. Diese Systeme arbeiten mit äußerst ausgeklügelten, olernfähigen neuronalen netzwerken. Ähnlich wie das bereits hier vorgestellte DeepL für übersetzungen. Man sollte sich aber darüber im klaren sein das alles was man eingibt ob text, bild oder audio bis ins kleinste von aussenstehenden Servern aufgenommen, analysiert und womöglich auch gespeichert wird. Anders als bloßes abspechern von Audiomaterial wird hier auch inhaltlich ausgewertet.
Wenn jemand ne gute app kennt die da drauf zurückgreift?

Aber mal im ernst Samuel, je nach umfang des Audiomaterials kommste mit abtippen am billigsten und einfachsten an dein Ziel. Der text muss sowieso mühsam händisch nachkorrigiert werden.

Edit: Ich hab diese Google Speech Api in der Testversion jetzt mal getestet mittels eines YT Videos, also ohne selber irgendwas ins Mikro zu quatschen. Und wie erwartet sind die ergebnisse nicht zufriedenstellend. Besonders in der Formatierung, satzzeichen fehlen, oftmals mittendrinn was falsches erkannt usw.
Aber erstaunlich was alles richtig erkannt wird. ZB. "4000 Euro" wird komplett richtig erkannt und formatiert.
Aber wie gesagt: Ergebnisse nicht wirklich verwertbar ohne dass man sehr viel nacharbeitet! Letztlich isses einfacher es gleich selber abzutippen wenn man ansatzweise ein wenig was auf der Tastatur drauf hat.


Zum Testaufbau:
URL zuir Testapi: https://cloud.google.com/speech/?hl=de
Die atestversion läuft nur ne knappe minute gleube ich.
Mikro wird benotigt und dem browser erlauben das mikro zu benutzen. Alternativ kann man zum testen einfach in Win 10 als Aufnahmegerät statt das Mikro einfach "Stereo-Mix" wählen". Dann wird einfach alles was durch die soundausgabe nach außen widergegeben wird einfach auch als mikroeingabe gehandhabt. Also ein YT Video wird wie eine eingabe ins Mikro behandelt.

Beispiel:

Zitat

was Versammlung ist und wie man sie erzieht Versuch einer Definition wenn ein Pferd mit den Hinterbeinen fleißig weit unter den home.ch oft und Kniegelenk gebeugt die Hinterhand senkt sich von hinten nach fahren zusammen steht da und damit seine Unterstützungsfläche verkleinert sein Schwerpunkt durch ausrichten heißt und Koch und die Vorderbeine entlastet sagt man etwa Versand



Oder:

Zitat

und wahrscheinlich noch ganz klein war wurde ich geboren von meiner Mutter was um späteren schreckliche Auswirkungen auf die Psyche eines Kindes zu vermeiden ungemein praktisch war meine Mutter lag 3 Tage mit mir in den Wehen was wir an Weihnachten immer aufs Neue von ihr erzählt bekommen hat mir noch nie gehört ich vermute dass meine Mutter auch wirklich glaubt dass sie uns das noch nie erzählt hat man keine Sorge sie leidet nicht an Alzheimer oder Demenz das würde vieles erklären sie ist eben einfach nur eine Mutter und ich glaube dass alle Mütter einen Knall haben und fürsorglichen Barmherzigen Nerven zerfetzen und bisweilen in den Wahnsinn treiben den Knall

Zitat

solange gedauert hat immer mit einer Floskel Antworten aller das ist jedes Mal anders da steckt man nicht drin danke für das Wortspiel ich persönlich glaube aber dass ich damals tatsächlich ganz bewusst nicht aus dem Bauch heraus wollte warum ich kann dir ja schon meine ganze Familie es stimmt nämlich man sich da drin schon eine Menge von draußen mit wenn er sich auch noch anhört als würden alle durch ein Schnorchel sprechen und die Gesichter verschwommen Licht erscheinen das eigentlich auch reicht glauben Sie mir live und in Farbe nicht wirklich dazu gewonnen

Dieser Beitrag wurde bereits 6 mal editiert, zuletzt von »samuelclemens« (30. März 2018, 15:52)

  • Zum Seitenanfang

samuel

Überlieferer der Zeit

Registrierungsdatum: 9. Juni 2011

Beiträge: 9 504 Aktivitäts Punkte: 39 125

10

Samstag, 31. März 2018, 00:08

Mir war ja klar, dass es schwierig wird, aber hätte ja sein können, dass es schon so etwas gibt. Im Bereich Computertechnik ist die Entwicklung einfach so schnell und fortgeschritten, dass man sie einfach nicht überblicken kann. Wer vor zwanzig Jahren sich die Welt vorgestellt hat, wie sie heute ist, hat ja auch Unvorstellbares geträumt. Eben für damalige Verhältnisse. Ich erinnere mich noch an meinen ersten PC, ein richtiges Klopperteil mit Windows 98, der Röhrenfernseher überlebte die Expo 2000 im heimischen Wohnzimmer um ein paar Monate, stammte noch aus den Anfang der 90er Jahre. Und da hätte mich eine Sprachsoftware, wie ich sie oben gesucht habe, nicht gewundert. Ich habe selbst ein paar Programme gefunden, die aber alle noch so ziemlich in den Kinderschuhen stecken, aber wer weiß? Wenn ich diese Frage in ein paar Jahren stellen würde, was da vielleicht möglich ist.

Ich mag ja gerne an lebens- und arbeitserleichternde Maßnahmen glauben. ;)

Habe inzwischen zwei Korrektoren gefunden, mit genügend Futter im Keller eingesperrt, die zumindest Lektorat und Korrektur übernehmen.
Wenn ich mit den anderen Texten morgen fertig werde, kann ich vielleicht vor der Tempokids-Gala den ersten schon veröffentlichen.
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

11

Samstag, 31. März 2018, 00:56

Viel interessanter fände ich sowieso eine Software die brauchbare Text zu Audio resultate liefert.

So als Hörbuchersatz wär das klasse. Einfach ein eBook reinschieben und umwandeln lassen. Am besten noch auf verschiedene Stimmuster trainierbar indem man ein paar hundert gesprochener Wörter aus einem Video oder Audioaufzeichnung einspeist.
So könnte man sich dann mal eben schnell n Hörbuch von Angela Merkel oder der Nostalgie wegen von Mutti "Vorlesen" lassen!
  • Zum Seitenanfang

Pauly

Lebende Foren Legende

Registrierungsdatum: 27. Oktober 2010

Beiträge: 1 209 Aktivitäts Punkte: 6 225

Wohnort: Schleswig Holstein

12

Samstag, 31. März 2018, 13:16

@samuelclemens

nimm mal ein PDF und öffne es mit MS Edge. In den Einstellungen "Laut Vorlesen" auswählen. Der Ansatz ist da, Betonung natürlich noch mangelhaft.

[attach]57142[/attach]
  • Zum Seitenanfang

samuelclemens

Herrscher über Raum, Zeit und Materie

Registrierungsdatum: 12. Februar 2006

Beiträge: 3 471 Aktivitäts Punkte: 18 155

Danksagungen: 3

Wohnort: Wo immer ich meinen Umhang fallen lasse!

13

Samstag, 31. März 2018, 17:02

@samuelclemens

nimm mal ein PDF und öffne es mit MS Edge. In den Einstellungen "Laut Vorlesen" auswählen. Der Ansatz ist da, Betonung natürlich noch mangelhaft.

Text zu Audio resultate liefert.pdf



Kenne ich schon alles was es so für Lau auf dem MArkt gibt. Deshalb sprach ich auch von brauchbaren Resultaten!
Bei den teuren Gewerblichen Angeboten kann ich leider nicht mitreden. Meist bekommt man auch so ne penetrant nervige Frauenstimme. Ich bin eher an Hörbücher a la "Oliver Rohrbeck" gewöhnt.
Schon bei Navis macht man ja diesen Fehler. Welcher Typ will schon ne ständig dazwischenquatschende Braut die einem dauernd den Weg erklärt im Auto? :wech:
  • Zum Seitenanfang