Analiza dźwięku

wino · Post autor: **wino** » 09 lut 2006 14:45

witam

Są w LabVIEW jakieś bloczki do analizy dźwięku?

Na przykład takie żeby można było mając nagrany głos rozpoznawać słowa albo litery?

PMaj · Post autor: **PMaj** » 09 lut 2006 16:41

witam

nie ma - trzeba samemu napisac

przynajmniej nie bylo pół roku temu jak szukałem gotowców

pzdrv

jogurt_owocowy · Post autor: **jogurt_owocowy** » 22 mar 2006 12:40

Nastąpiły jakieś postępy w temacie?
Akurat piszę z tego magisterkę i można by ten ciekawy temat jakoś pociągnąć, może nawet kiedyś zrobić jakiś własny toolbox?!
A jakie konkretnie zastosowanie Cię interesuje?

wino · Post autor: **wino** » 22 mar 2006 21:23

witam

interesuje mnie zrobienie systemu, który pozwoliłby na sterowanie komputerem bez użycia klawiatury. Właściwie to na wydawaniu poleceń w stylu "kopiuj", itp.

Wiem, że jest to problem do rozwiązania i nie jest strasznie skomplikowany. Mam pełno materiałów o rozpoznawaniu mowy i na razie to się dokształcam:)(na takim etapie na razie jestem)

Wiem jak sie zabrać do analizy, ale brakuje mi jeszcze troche(dużo) teorii. Jak ją zdobęde, rusze do ataku. Właściwie to już ruszyłem, bo mam część "mechaniczną". Brakuje mi tylko analizy mowy i system będzie gotowy:).

pozdrawiam

wszelka pomoc mile widziana i wzajemnie, ale myśle ze wiesz ode mnie znacznie wiecej i nie wiele ci pomoge, ale zawsze można zapytać

jogurt_owocowy · Post autor: **jogurt_owocowy** » 23 mar 2006 22:10

Akurat robiłem coś podobnego - slajdy w Power Poincie przełącza ładnie:)
Ale metoda użyta do tego(Dynamic Time Warping) nie była ani najprostsza, ani najskuteczniejsza (choć całkiem zadowalająca) ani optymalna. Było to trochę "przy okazji"-DTW będzie służyć innym celom:)
Takie rozpoznawanie izolowanych słów to rzeczywiście nie jest sprawa bardzo trudna, ale w czystym LV, z dość ograniczonymi funkcjami DSP może nie być tak banalnie.
Pierwsza narzucająca się myśl to stworzenie wzorców rozpoznawanych słów za pomocą, jakiejś reprezentacji czasowo-częstotliwościowej sygnału i potem porównywanie ich z sygnałem testowym. Niestety w LV jest "gotowa" tylko metoda STFT(Short Time Fourier Transform), a ta nie jest bardzo skuteczna. A "skuteczna" w takim zastosowaniu to powinno być ponad 95% nawet przy założeniu niezależności od mówcy.
Z moich dotychczasowych doświadczeń mogę napisać tyle, że najlepiej wypadają metody oparte na dekompozycji falkowej i współczynnikach cepstrum(MFCC).
Kręci mi się po głowie jeszcze jeden, banalny w zasadzie pomysł, ale napiszę coś więcej jak będę miał czas go sprawdzić.

Pozdrawiam

askorek · Post autor: **askorek** » 21 sty 2008 22:47

sorry, że odgrzebuje taki stary temat, ale ciekawi mnie w jaki sposób przełączałeś slajdy? virtual keybord albo coś podobnego? poobcinany virtual keybord wydaje mi się najprostrzy w realizacji, ale może jest coś lepszego?

jogurt_owocowy · Post autor: **jogurt_owocowy** » 21 sty 2008 23:40

Zgadłeś

TUTAJ znajdziesz gotowca.
Pozdrawiam

rumcajs · Post autor: **rumcajs** » 29 sty 2008 06:29

Pod Vistą to nie będzie większego problemu:
Voice recognition - presentation
A jeżeli nie to można spróbować:
Voice recognition
Rumcajs.

Polskie Centrum LabVIEW