przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Moderator: Moderatorzy
-
- Początkujący użytkownik forum
- Posty: 9
- Rejestracja: 2009-08-16, 16:54
- Lokalizacja: Opole
przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Witam!
Chciałbym stworzyć pewien system, który wymagałby rozwiązania dwóch problemów. Byłbym wdzięczny, gdyby ktoś mógłby mi zasugerować jakieś tutoriale (również anglojęzyczne) / technologie / książki wydawnictwa Helion lub inne, które mogłyby mi pomóc w osiągięciu celu. Chciałbym:
1. Przesłać dane dźwiękowe z telefonu komórkowego do serwera. Osoba posiadająca telefon dzwoniłaby pod specjalny numer i dyktowała ciąg cyfr.
2. Przeanalizować na serwerze te dane i zapisać ciąg cyfr z pliku dźwiękowego do pliku tekstowego (analiza mowy; wymaga rozpoznawania tylko dziesięciu słów - cyfr i kilku dodatkowych).
Z góry dzięki za wszelkie sugestie!
Pozdrawiam!
Chciałbym stworzyć pewien system, który wymagałby rozwiązania dwóch problemów. Byłbym wdzięczny, gdyby ktoś mógłby mi zasugerować jakieś tutoriale (również anglojęzyczne) / technologie / książki wydawnictwa Helion lub inne, które mogłyby mi pomóc w osiągięciu celu. Chciałbym:
1. Przesłać dane dźwiękowe z telefonu komórkowego do serwera. Osoba posiadająca telefon dzwoniłaby pod specjalny numer i dyktowała ciąg cyfr.
2. Przeanalizować na serwerze te dane i zapisać ciąg cyfr z pliku dźwiękowego do pliku tekstowego (analiza mowy; wymaga rozpoznawania tylko dziesięciu słów - cyfr i kilku dodatkowych).
Z góry dzięki za wszelkie sugestie!
Pozdrawiam!
- Jo_gurt
- Guru bezprzewodowy
- Posty: 16330
- Rejestracja: 2007-11-16, 21:49
- Lokalizacja: Lublin
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Tzn tak: nie mam zielonego pojęcia jak to zrobić, ale moje przemyślenia na ten temat:
1. Z telefonu komórkowego do serwera za pomocą zwykłego połączenia głosowego? Pewnie by się coś dało zrobić z numerem VoIP i nagrywaniem do pliku. Jeśli natomiast chodzi o bezpośrednie połączenie np. via WiFi to musiałby być na telefonie jakiś specjalny soft.
2. Tu chcesz od podstaw napisać soft do rozpoznawania mowy? Może skorzystać np z http://en.wikipedia.org/wiki/Speech_App ... _Interface
Są też dostępne biblioteki gotowe do oprogramowania, ale to wszystko co wiem na ten temat
1. Z telefonu komórkowego do serwera za pomocą zwykłego połączenia głosowego? Pewnie by się coś dało zrobić z numerem VoIP i nagrywaniem do pliku. Jeśli natomiast chodzi o bezpośrednie połączenie np. via WiFi to musiałby być na telefonie jakiś specjalny soft.
2. Tu chcesz od podstaw napisać soft do rozpoznawania mowy? Może skorzystać np z http://en.wikipedia.org/wiki/Speech_App ... _Interface
Są też dostępne biblioteki gotowe do oprogramowania, ale to wszystko co wiem na ten temat

- KrissTofferr
- Mistrz bezprzewodowy
- Posty: 1271
- Rejestracja: 2008-03-11, 14:15
- Lokalizacja: Lubelskie
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
1. Może automatyczna sekretarka uruchamiana na kompie z modemem ISDN.
2. "speech to text" site:sourceforge.net
2. "speech to text" site:sourceforge.net
- Jo_gurt
- Guru bezprzewodowy
- Posty: 16330
- Rejestracja: 2007-11-16, 21:49
- Lokalizacja: Lublin
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Z tym pewnie może być różnieKrissTofferr pisze:z modemem ISDN.

-
- Początkujący użytkownik forum
- Posty: 9
- Rejestracja: 2009-08-16, 16:54
- Lokalizacja: Opole
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
You're great, man :-).KrissTofferr pisze:1. Może automatyczna sekretarka uruchamiana na kompie z modemem ISDN.
2. "speech to text" site:sourceforge.net
Możesz napisać coś więcej, dlaczego tak uważasz? Widzisz jakąś dobrą alternatywę dla takiego rozwiązania?Jo_gurt pisze:Z tym pewnie może być różnieKrissTofferr pisze:z modemem ISDN.
Ja tymczasem zabieram się za czytanie dokumentacji tego ivam2 :-).
Co do "speech to text" to może:
http://cmusphinx.sourceforge.net/sphinx4/
http://sourceforge.net/projects/mystt/
Będę się musial też wybrać do księgarni Helion, czy jest jakaś książka, którą byście polecili :-)?
Pozdrawiam!
- Jo_gurt
- Guru bezprzewodowy
- Posty: 16330
- Rejestracja: 2007-11-16, 21:49
- Lokalizacja: Lublin
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Różnie w sensie: masz ISDN?johnyjj2 pisze:Możesz napisać coś więcej, dlaczego tak uważasz?
- KrissTofferr
- Mistrz bezprzewodowy
- Posty: 1271
- Rejestracja: 2008-03-11, 14:15
- Lokalizacja: Lubelskie
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
W Play24 jest możliwość ustawienia przesyłania wiadomości poczty głosowej na adres e-mail. Plik dźwiękowy .WAV (8kHz, CCITT A-law) przychodzi w załączniku wiadomości email.
- KrissTofferr
- Mistrz bezprzewodowy
- Posty: 1271
- Rejestracja: 2008-03-11, 14:15
- Lokalizacja: Lubelskie
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Małe usprawnienie dotyczące mojego poprzedniego postu:
Jeśli na telefonie docelowym zablokujemy połączenia głosowe wtedy dzwoniąc na jego numer natychmiast uruchamia się poczta głosowa.
Jeśli na telefonie docelowym zablokujemy połączenia głosowe
Kod: Zaznacz cały
AT+CGCLASS="CG"
-
- Początkujący użytkownik forum
- Posty: 9
- Rejestracja: 2009-08-16, 16:54
- Lokalizacja: Opole
Re: przesyłanie bezprzewodowych danych :: rozpoznawanie mowy
Dzięki za odpowiedź :-)!
Na dzień dzisiejszy to mam takie dwa pomysły. Pierwszy (lepszy pomysł) to rozpoznawanie mowy na komórce z PocketSphinksem. Mam jednak pewien problem z edycją/build/uruchomieniem programów w PocketSphinksie, stąd też byłbym bardzo wdzięczny, gdyby ktoś mi z tym pomógł. Temat znajduje się tutaj: http://forum.4programmers.net/viewtopic ... 5#id584575
Drugi zaś pomysł (raczej gorszy) to telefon komórkowy ze Skypem, który się łączy ze Skypem na serwerze. Przekierowanie mowy na serwerze ze Skype'a do Sphinksa4 przy pomocy Office Communication Server 2007. Temat jest tutaj: http://forum.skype.com/index.php?s=b889 ... try2140431
Przy okazji pracuję też nad modelem akustycznym języka polskiego na VoxForge (http://www.voxforge.org/home/forums/mes ... e-model/14).
Pozdrawiam!
[ Komentarz dodany przez: YaHooo: 2009-11-18, 20:00 ]
Na naszym forum przyznajemy punkty pomógł maksymalnie raz w wątku dla danego użytkownika. Dlatego usunąłem nadmiarowe punkty.
Na dzień dzisiejszy to mam takie dwa pomysły. Pierwszy (lepszy pomysł) to rozpoznawanie mowy na komórce z PocketSphinksem. Mam jednak pewien problem z edycją/build/uruchomieniem programów w PocketSphinksie, stąd też byłbym bardzo wdzięczny, gdyby ktoś mi z tym pomógł. Temat znajduje się tutaj: http://forum.4programmers.net/viewtopic ... 5#id584575
Drugi zaś pomysł (raczej gorszy) to telefon komórkowy ze Skypem, który się łączy ze Skypem na serwerze. Przekierowanie mowy na serwerze ze Skype'a do Sphinksa4 przy pomocy Office Communication Server 2007. Temat jest tutaj: http://forum.skype.com/index.php?s=b889 ... try2140431
Przy okazji pracuję też nad modelem akustycznym języka polskiego na VoxForge (http://www.voxforge.org/home/forums/mes ... e-model/14).
Pozdrawiam!
[ Komentarz dodany przez: YaHooo: 2009-11-18, 20:00 ]
Na naszym forum przyznajemy punkty pomógł maksymalnie raz w wątku dla danego użytkownika. Dlatego usunąłem nadmiarowe punkty.