background preloader

Spracherkennung

Facebook Twitter

Polyglot 3000. Language Identifier – Polyglot 3000. Text & voice recognition web apps. Sprach-Interaktion. Allgemeines[Bearbeiten] Sprach-Interaktion ist ein immer beliebter werdendes Thema, was auch Blinden oder Körperlichbehinderten zu gute kommt.

Sprach-Interaktion

Es ermöglicht das Vorlesen und Diktieren von Texten, sowie das Steuern ganzer Systeme. Definitionen[Bearbeiten] Spracherkennung wird im Allgemeinen mit SR (Speech Recognition) abgekürzt. Sprachsynthese wird im Allgemeinen mit TTS (Text to Speech) abgekürzt. Unterkategorien Diese Kategorie enthält folgende Unterkategorie:In Klammern die Anzahl der enthaltenen Kategorien (K), Seiten (S), Dateien (D) Seiten in der Kategorie „Sprach-Interaktion“ Es werden 14 von insgesamt 14 Seiten in dieser Kategorie angezeigt: Sprachsteuerung. Als Sprachsteuerung bezeichnet man die Übermittlung von Befehlen an technische Geräte, die per Stimme erfolgt.

Sprachsteuerung

Grundsätzlich kann das Prinzip der Sprachsteuerung bei einer sehr großen Zahl von Gerätetypen zum Einsatz kommen. Voraussetzung ist, dass es ein Modul für Spracherkennung gibt, das sprachliche Äußerungen aufnehmen und interpretieren kann. Bisherige Einsatzbereiche[Bearbeiten] Sprachsteuerung wird außerdem auch bei Navigationssystemen in Pkws eingesetzt. Der Fahrer muss nicht mehr mit der Hand per Tasten, Touchscreen oder Scrollrad seine Zielroute eingeben, sondern kann die Befehle und ebenso die Straßen- und Ortsnamen per Spracheingabe an das Gerät übermitteln. Softwareauswahl[Bearbeiten] Siehe auch[Bearbeiten]

Sprachsteuerung

Voice command device. Newer VCDs are speaker-independent, so they can respond to multiple voices, regardless of accent or dialectal influences.

Voice command device

They are also capable of responding to several commands at once, separating vocal messages, and providing appropriate feedback, accurately imitating a natural conversation.[1] They can understand around 50 different commands and retain up to 2 minutes of vocal messages.[1] VCDs can be found in computer operating systems, commercial software for computers, mobile phones, cars, call centers, and internet search engines such as Google.

In 2007, a CNN business article reported that voice command was over a billion dollar industry and that companies like Google and Apple were trying to create voice recognition features.[2] It has been years since the article was published, and since then the world has witnessed a variety of voice command devices. In addition, Google created a voice recognition engine called Pico TTS and Apple has released Siri. Microsoft Windows[edit] Computerlinguistik. Spracherkennung. Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik.

Spracherkennung

Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation.

Allerdings ähneln sich die Realisierungen dieser Verfahren. Geschichtliche Entwicklung[Bearbeiten] Die Forschung an Spracherkennungssystemen begann in den 1960er Jahren, verlief damals allerdings weitestgehend erfolglos: Die von privaten Firmen entwickelten Systeme ermöglichten unter Laborbedingungen die Erkennung von einigen Dutzend Einzelwörtern. Erst Mitte der 1980er Jahre kam die Entwicklung weiter voran. 2007 wurde die Firma Siri Inc. gegründet und im April 2010 von Apple gekauft. Siehe auch: Stenomaske. Speech recognition. Speech recognition is usually processed in middleware, the results are transmitted to the user applications.

Speech recognition

In Computer Science and Electrical Engineering speech recognition (SR) is the translation of spoken words into text. It is also known as "automatic speech recognition" (ASR), "computer speech recognition", or just "speech to text" (STT). Some SR systems use "speaker independent speech recognition"[1] while others use "training" where an individual speaker reads sections of text into the SR system. These systems analyze the person's specific voice and use it to fine tune the recognition of that person's speech, resulting in more accurate transcription. Systems that do not use training are called "speaker independent" systems. Speech recognition applications include voice user interfaces such as voice dialling (e.g. The term voice recognition[2][3][4] or speaker identification[5][6] refers to finding the identity of "who" is speaking, rather than what they are saying. Military[edit]