Analiza dźwięku
- wino
- Posty: 549
- Rejestracja: 23 gru 2005 00:00
- Wersja środowiska: Nie mam LabVIEW
- Lokalizacja: Kraków
Analiza dźwięku
witam
Są w LabVIEW jakieś bloczki do analizy dźwięku?
Na przykład takie żeby można było mając nagrany głos rozpoznawać słowa albo litery?
Są w LabVIEW jakieś bloczki do analizy dźwięku?
Na przykład takie żeby można było mając nagrany głos rozpoznawać słowa albo litery?
Re: Analiza dźwięku
witam
nie ma - trzeba samemu napisac
przynajmniej nie bylo pół roku temu jak szukałem gotowców
pzdrv
nie ma - trzeba samemu napisac
przynajmniej nie bylo pół roku temu jak szukałem gotowców
pzdrv
Nie jestem leniwy
Mam zawyżone wymagania motywacyjne
Mam zawyżone wymagania motywacyjne
- jogurt_owocowy
- Posty: 1317
- Rejestracja: 30 lis 2004 00:00
- Wersja środowiska: LabVIEW 2015
- Lokalizacja: Kraków
Re: Analiza dźwięku
Nastąpiły jakieś postępy w temacie?
Akurat piszę z tego magisterkę i można by ten ciekawy temat jakoś pociągnąć, może nawet kiedyś zrobić jakiś własny toolbox?!
A jakie konkretnie zastosowanie Cię interesuje?
Akurat piszę z tego magisterkę i można by ten ciekawy temat jakoś pociągnąć, może nawet kiedyś zrobić jakiś własny toolbox?!
A jakie konkretnie zastosowanie Cię interesuje?
- wino
- Posty: 549
- Rejestracja: 23 gru 2005 00:00
- Wersja środowiska: Nie mam LabVIEW
- Lokalizacja: Kraków
Re: Analiza dźwięku
witam
interesuje mnie zrobienie systemu, który pozwoliłby na sterowanie komputerem bez użycia klawiatury. Właściwie to na wydawaniu poleceń w stylu "kopiuj", itp.
Wiem, że jest to problem do rozwiązania i nie jest strasznie skomplikowany. Mam pełno materiałów o rozpoznawaniu mowy i na razie to się dokształcam:)(na takim etapie na razie jestem)
Wiem jak sie zabrać do analizy, ale brakuje mi jeszcze troche(dużo) teorii. Jak ją zdobęde, rusze do ataku. Właściwie to już ruszyłem, bo mam część "mechaniczną". Brakuje mi tylko analizy mowy i system będzie gotowy:).
pozdrawiam
wszelka pomoc mile widziana i wzajemnie, ale myśle ze wiesz ode mnie znacznie wiecej i nie wiele ci pomoge, ale zawsze można zapytać
interesuje mnie zrobienie systemu, który pozwoliłby na sterowanie komputerem bez użycia klawiatury. Właściwie to na wydawaniu poleceń w stylu "kopiuj", itp.
Wiem, że jest to problem do rozwiązania i nie jest strasznie skomplikowany. Mam pełno materiałów o rozpoznawaniu mowy i na razie to się dokształcam:)(na takim etapie na razie jestem)
Wiem jak sie zabrać do analizy, ale brakuje mi jeszcze troche(dużo) teorii. Jak ją zdobęde, rusze do ataku. Właściwie to już ruszyłem, bo mam część "mechaniczną". Brakuje mi tylko analizy mowy i system będzie gotowy:).
pozdrawiam
wszelka pomoc mile widziana i wzajemnie, ale myśle ze wiesz ode mnie znacznie wiecej i nie wiele ci pomoge, ale zawsze można zapytać
- jogurt_owocowy
- Posty: 1317
- Rejestracja: 30 lis 2004 00:00
- Wersja środowiska: LabVIEW 2015
- Lokalizacja: Kraków
Re: Analiza dźwięku
Akurat robiłem coś podobnego - slajdy w Power Poincie przełącza ładnie:)
Ale metoda użyta do tego(Dynamic Time Warping) nie była ani najprostsza, ani najskuteczniejsza (choć całkiem zadowalająca) ani optymalna. Było to trochę "przy okazji"-DTW będzie służyć innym celom:)
Takie rozpoznawanie izolowanych słów to rzeczywiście nie jest sprawa bardzo trudna, ale w czystym LV, z dość ograniczonymi funkcjami DSP może nie być tak banalnie.
Pierwsza narzucająca się myśl to stworzenie wzorców rozpoznawanych słów za pomocą, jakiejś reprezentacji czasowo-częstotliwościowej sygnału i potem porównywanie ich z sygnałem testowym. Niestety w LV jest "gotowa" tylko metoda STFT(Short Time Fourier Transform), a ta nie jest bardzo skuteczna. A "skuteczna" w takim zastosowaniu to powinno być ponad 95% nawet przy założeniu niezależności od mówcy.
Z moich dotychczasowych doświadczeń mogę napisać tyle, że najlepiej wypadają metody oparte na dekompozycji falkowej i współczynnikach cepstrum(MFCC).
Kręci mi się po głowie jeszcze jeden, banalny w zasadzie pomysł, ale napiszę coś więcej jak będę miał czas go sprawdzić.
Pozdrawiam
Ale metoda użyta do tego(Dynamic Time Warping) nie była ani najprostsza, ani najskuteczniejsza (choć całkiem zadowalająca) ani optymalna. Było to trochę "przy okazji"-DTW będzie służyć innym celom:)
Takie rozpoznawanie izolowanych słów to rzeczywiście nie jest sprawa bardzo trudna, ale w czystym LV, z dość ograniczonymi funkcjami DSP może nie być tak banalnie.
Pierwsza narzucająca się myśl to stworzenie wzorców rozpoznawanych słów za pomocą, jakiejś reprezentacji czasowo-częstotliwościowej sygnału i potem porównywanie ich z sygnałem testowym. Niestety w LV jest "gotowa" tylko metoda STFT(Short Time Fourier Transform), a ta nie jest bardzo skuteczna. A "skuteczna" w takim zastosowaniu to powinno być ponad 95% nawet przy założeniu niezależności od mówcy.
Z moich dotychczasowych doświadczeń mogę napisać tyle, że najlepiej wypadają metody oparte na dekompozycji falkowej i współczynnikach cepstrum(MFCC).
Kręci mi się po głowie jeszcze jeden, banalny w zasadzie pomysł, ale napiszę coś więcej jak będę miał czas go sprawdzić.
Pozdrawiam
Analiza dźwięku
sorry, że odgrzebuje taki stary temat, ale ciekawi mnie w jaki sposób przełączałeś slajdy? virtual keybord albo coś podobnego? poobcinany virtual keybord wydaje mi się najprostrzy w realizacji, ale może jest coś lepszego?
- jogurt_owocowy
- Posty: 1317
- Rejestracja: 30 lis 2004 00:00
- Wersja środowiska: LabVIEW 2015
- Lokalizacja: Kraków
Re: Analiza dźwięku
Pod Vistą to nie będzie większego problemu:
Voice recognition - presentation
A jeżeli nie to można spróbować:
Voice recognition
Rumcajs.
Voice recognition - presentation
A jeżeli nie to można spróbować:
Voice recognition
Rumcajs.