przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Zagadnienia dotyczące technice w szerokim tego pojęcia znaczeniu czyli luźne dyskusje o zagadnieniach technicznych ale nie związanych z główną tematyką forum, m.in, komputery, oprogramowanie, systemy operacyjne - techniczny Hyde-Park.

Moderator: Moderatorzy

ODPOWIEDZ
johnyjj2
Początkujący użytkownik forum
Posty: 9
Rejestracja: 2009-08-16, 16:54
Lokalizacja: Opole

przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: johnyjj2 »

Witam!

Chciałbym stworzyć pewien system, który wymagałby rozwiązania dwóch problemów. Byłbym wdzięczny, gdyby ktoś mógłby mi zasugerować jakieś tutoriale (również anglojęzyczne) / technologie / książki wydawnictwa Helion lub inne, które mogłyby mi pomóc w osiągięciu celu. Chciałbym:
1. Przesłać dane dźwiękowe z telefonu komórkowego do serwera. Osoba posiadająca telefon dzwoniłaby pod specjalny numer i dyktowała ciąg cyfr.
2. Przeanalizować na serwerze te dane i zapisać ciąg cyfr z pliku dźwiękowego do pliku tekstowego (analiza mowy; wymaga rozpoznawania tylko dziesięciu słów - cyfr i kilku dodatkowych).

Z góry dzięki za wszelkie sugestie!
Pozdrawiam!
Awatar użytkownika
Jo_gurt
Guru bezprzewodowy
Posty: 16330
Rejestracja: 2007-11-16, 21:49
Lokalizacja: Lublin

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: Jo_gurt »

Tzn tak: nie mam zielonego pojęcia jak to zrobić, ale moje przemyślenia na ten temat:
1. Z telefonu komórkowego do serwera za pomocą zwykłego połączenia głosowego? Pewnie by się coś dało zrobić z numerem VoIP i nagrywaniem do pliku. Jeśli natomiast chodzi o bezpośrednie połączenie np. via WiFi to musiałby być na telefonie jakiś specjalny soft.
2. Tu chcesz od podstaw napisać soft do rozpoznawania mowy? Może skorzystać np z http://en.wikipedia.org/wiki/Speech_App ... _Interface
Są też dostępne biblioteki gotowe do oprogramowania, ale to wszystko co wiem na ten temat ;)
Awatar użytkownika
KrissTofferr
Mistrz bezprzewodowy
Posty: 1271
Rejestracja: 2008-03-11, 14:15
Lokalizacja: Lubelskie

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: KrissTofferr »

1. Może automatyczna sekretarka uruchamiana na kompie z modemem ISDN.

2. "speech to text" site:sourceforge.net
Awatar użytkownika
Jo_gurt
Guru bezprzewodowy
Posty: 16330
Rejestracja: 2007-11-16, 21:49
Lokalizacja: Lublin

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: Jo_gurt »

KrissTofferr pisze:z modemem ISDN.
Z tym pewnie może być różnie :)
johnyjj2
Początkujący użytkownik forum
Posty: 9
Rejestracja: 2009-08-16, 16:54
Lokalizacja: Opole

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: johnyjj2 »

KrissTofferr pisze:1. Może automatyczna sekretarka uruchamiana na kompie z modemem ISDN.

2. "speech to text" site:sourceforge.net
You're great, man :-).
Jo_gurt pisze:
KrissTofferr pisze:z modemem ISDN.
Z tym pewnie może być różnie :)
Możesz napisać coś więcej, dlaczego tak uważasz? Widzisz jakąś dobrą alternatywę dla takiego rozwiązania?

Ja tymczasem zabieram się za czytanie dokumentacji tego ivam2 :-).

Co do "speech to text" to może:
http://cmusphinx.sourceforge.net/sphinx4/
http://sourceforge.net/projects/mystt/

Będę się musial też wybrać do księgarni Helion, czy jest jakaś książka, którą byście polecili :-)?

Pozdrawiam!
Awatar użytkownika
Jo_gurt
Guru bezprzewodowy
Posty: 16330
Rejestracja: 2007-11-16, 21:49
Lokalizacja: Lublin

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: Jo_gurt »

johnyjj2 pisze:Możesz napisać coś więcej, dlaczego tak uważasz?
Różnie w sensie: masz ISDN?
Awatar użytkownika
KrissTofferr
Mistrz bezprzewodowy
Posty: 1271
Rejestracja: 2008-03-11, 14:15
Lokalizacja: Lubelskie

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: KrissTofferr »

W Play24 jest możliwość ustawienia przesyłania wiadomości poczty głosowej na adres e-mail. Plik dźwiękowy .WAV (8kHz, CCITT A-law) przychodzi w załączniku wiadomości email.
Awatar użytkownika
KrissTofferr
Mistrz bezprzewodowy
Posty: 1271
Rejestracja: 2008-03-11, 14:15
Lokalizacja: Lubelskie

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: KrissTofferr »

Małe usprawnienie dotyczące mojego poprzedniego postu:

Jeśli na telefonie docelowym zablokujemy połączenia głosowe

Kod: Zaznacz cały

AT+CGCLASS="CG"
wtedy dzwoniąc na jego numer natychmiast uruchamia się poczta głosowa.
johnyjj2
Początkujący użytkownik forum
Posty: 9
Rejestracja: 2009-08-16, 16:54
Lokalizacja: Opole

Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy

Post autor: johnyjj2 »

Dzięki za odpowiedź :-)!

Na dzień dzisiejszy to mam takie dwa pomysły. Pierwszy (lepszy pomysł) to rozpoznawanie mowy na komórce z PocketSphinksem. Mam jednak pewien problem z edycją/build/uruchomieniem programów w PocketSphinksie, stąd też byłbym bardzo wdzięczny, gdyby ktoś mi z tym pomógł. Temat znajduje się tutaj: http://forum.4programmers.net/viewtopic ... 5#id584575

Drugi zaś pomysł (raczej gorszy) to telefon komórkowy ze Skypem, który się łączy ze Skypem na serwerze. Przekierowanie mowy na serwerze ze Skype'a do Sphinksa4 przy pomocy Office Communication Server 2007. Temat jest tutaj: http://forum.skype.com/index.php?s=b889 ... try2140431

Przy okazji pracuję też nad modelem akustycznym języka polskiego na VoxForge (http://www.voxforge.org/home/forums/mes ... e-model/14).

Pozdrawiam!

[ Komentarz dodany przez: YaHooo: 2009-11-18, 20:00 ]
Na naszym forum przyznajemy punkty pomógł maksymalnie raz w wątku dla danego użytkownika. Dlatego usunąłem nadmiarowe punkty.
ODPOWIEDZ