← Мақалаларға қайту

Voice-to-Text: Xeoma-ның сөйлеуді тануға арналған интеллектуалды модулі

Voice-to-Text: Xeoma-ның сөйлеуді тануға арналған интеллектуалды модулі

 


ЖИ негізіндегі Voice-to-Text Xeoma бейнебақылау бағдарламасының ЖИ-негізделген Voice-to-Text модулі камерадан немесе жеке микрофоннан келетін аудиоағынды «тыңдап», сөйлеуді таниды да, оның транскриптін CSV есебі түрінде сақтайды немесе алдын ала қарау терезесінде мәтін ретінде көрсетеді. Қажет болса, модульді нақты сөздерге немесе сөз тіркестеріне реакция жасауға баптауға болады. Сондай-ақ ол .mp3 аудиофайлдарымен (әңгіме жазбалары, оқыту видеолары және т.б.) жұмыс істеп, сөйлеуді мәтінге айналдырады.

Xeoma Voice-to-Text модулімен жұмыс істеу үшін арнайы жабдық қажет емес: кез келген камерадан немесе жеке микрофоннан келетін дыбысағын, сондай-ақ қарапайым дайын компьютерлер мен бейнекарталарды қолдануға болады.

Xeoma бейнебақылау бағдарламасының кеңесі Ескерту: бұл модуль Xeoma 24.8.12 нұсқасынан бастап қолжетімді және бета күйінде болғандықтан, кейбір сөздерді түсіріп қалуы немесе қайталаулар (ілгектер) орын алуы мүмкін.

 

 

ҚОЛДАНУ СЦЕНАРИЙЛЕРІ

Voice-to-Text модулі – әртүрлі мақсаттарда қолдануға болатын икемді құрал:

  • Call-центр: компания саясаты мен сөйлесу скрипттерінің сақталуын бақылау мақсатында ағымдағы қоңырауларды немесе олардың жазбаларын транскрипциялау
  • Қарттарға күтім: көмек сұраған айғайға лезде үн қату мүмкіндігі
  • Қалалық бақылау: контртеррористік қауіпсіздік аясында қауіпті білдіретін сөздерді тану
  • Ата-ана бақылауы: бала қауіпсіздігін қамтамасыз ету, оны буллингтен, сондай-ақ алаяқтар мен жыныстық зорлық жасаушылармен қарым-қатынастан қорғау
  • Полиция: полиция қызметкері мен күдікті арасындағы әңгімені транскрипциялау және қауіпті жағдайды анықтау мақсатында денеде тағылатын камераларға интеграциялау
  • Банктер, ломбардтар: физикалық түрде басуды қажет етпейтін «дабыл түймесі»
  • Зерттеу және аналитика: әртүрлі сөздердің қолданылу жиілігі бойынша статистика жинау және сөйлеуге қатысты басқа да зерттеулер жүргізу
  • Маркетинг: тұтынушылардың жарнамалық науқанды талқылауын, баннерге немесе жарнамаға реакциясын анықтау.
  • Кез келген бизнес: клиенттерге қызмет көрсету сапасын автоматты түрде бақылау (мысалы, балағат сөздерді анықтау)
  • Сүзгілеу және автоматтандыру: әңгімелердегі қалаусыз немесе тыйым салынған сөздер мен сөз тіркестерін анықтау әрі барлық жазбаларды тыңдамай-ақ, осындай эпизодтарды мұқият тексеруге бағыттау

Көріп тұрғаныңыздай, Xeoma бейнебақылау бағдарламасының «Voice-to-Text» құралын кең ауқымды сценарийлерде қолдануға болады! Бұл құрал жеке өмірдегі, қала мен тұрғындар қауіпсіздігін, сондай-ақ коммерциялық саланы жақсартып қана қоймай, бизнес-процестерді оңтайландыруға да септігін тигізеді.

 

VOICE-TO-TEXT МОДУЛІНІҢ АРТЫҚШЫЛЫҚТАРЫ:
Voice-to-Text модулінің артықшылықтары: кез келген жабдықпен үйлесімділік
Арнайы жабдықтардың қажеті жоқ:
Кәдімгі қолжетімді компьютерлер мен кез келген камераларды қолдануға болады.
Voice-to-Text модулінің артықшылықтары: икемді және әмбебап
Икемділігі жоғары:
Әртүрлі реакциялар, үшінші тарап жүйелерімен интеграция.
Voice-to-Text модулінің артықшылықтары: нақты уақыттағы өңдеу
Нақты уақытта жұмыс:
Кідіріссіз, нақты уақыт режимінде жұмыс істейді. Тек өз компьютеріңізде орындалады.
Voice-to-Text модулінің артықшылықтары: қолжетімді құны
Тиімді шешім:

Модуль Xeoma Pro лицензияларына енгізілген!

 

ЖҰМЫС ІСТЕУ ПРИНЦИПІ:

Ең алдымен, модульдер тізімінде бұл модуль тек Xeoma сервері тиісті жабдықта жұмыс істеп тұрғанда ғана көрсетілетінін атап өткен жөн. Егер модуль тізімде болмаса, сәйкес процессор мен Xeoma-ның тиісті нұсқасын (модуль тек Xeoma Pro нұсқасында қолжетімді) қолданып жатқаныңызға көз жеткізіңіз. Модуль аудиоағынмен жұмыс істейтіндіктен, тізбекте дыбыс көзі болуы шарт: камераға кіріктірілген микрофон немесе жеке USB не IP микрофон.

Мысалы, дыбыс ағыны жағдайыңызда IP-камераның өзінен келеді деп есептейік. Онда Xeoma жүйесінде «Universal Camera» – «Voice-to-Text» – «Preview and Archive» модульдер тізбегін қолданыңыз:

Voice-to-Text интеллектуалды модулі бар тізбек үлгісі

Модуль параметрлерін ашу үшін тізбектегі Voice-to-Text белгішесін басыңыз. Voice-to-Text модулімен жұмысты бастау үшін алдымен оған қажетті қосымша ресурстарды жүктеу керек. Ресурстарды жүктеу модуль параметрлерін алғаш ашқан кезде автоматты түрде іске қосылады. Жүктеу аяқталған соң, “Downloading in progress” хабарламасы жоғалады.

Voice-to-Text интеллектуалды модулінің баптаулары

 

Xeoma бейнебақылау бағдарламасының кеңесі Қосымша ресурстар Voice-to-Text негізделген жасанды интеллектке арналған деректер жиынтықтарын қамтиды және FelenaSoft серверлерінен сұраныс бойынша жүктеледі. Бағдарлама көлемін шағын ұстау және барлық бейнебақылау жүйелерінде міндетті түрде қажет болмауы себепті, олар бағдарлама құрамына кірмейді.

 

Қосымша ресурстар жүктелген соң ашылатын жаңа параметрлер сөйлеуді тану үшін қолданылатын ЖИ-негізді бірнеше дауыс тану моделінің ішінен таңдауға мүмкіндік береді. Әр модельдің өз артықшылықтары мен кемшіліктері бар: әдетте олар тану дәлдігі мен процессорға түсетін жүктеме деңгейімен ерекшеленеді. Модель өлшемінің, тану сапасының және аппараттық ресурстарға түсетін жүктеменің арту реті бойынша олар шартты түрде tiny, base, small, medium, large деп аталады.

Voice-to-Text интеллектуалды модулінің баптаулары

“Language” өрісінде сөйлеудің мәтіні қай тілде берілетінін таңдаңыз (сөйлеудің тілін көрсетудің қажеті жоқ).

Барлық естілетін әңгімелерді мәтінге айналдыру қажет болса, "Save data in CSV report" құсбелгісін бірден белгілеңіз. Бұл жағдайда әңгімелер мәтіні дискідегі көрсетілген қалтада кестелік файл ретінде сақталады; оны статистикалық жүйелер сияқты басқа жүйелерге интеграциялауға болады.

Сондай-ақ, "Voice-to-Text" нақты сөз тіркестері немесе сөздерді анықтай алады. Ізделінді сөздерді немесе тіркестерді "Keywords for recognition" өрісіне енгізіңіз. Осыдан кейін модуль камера немесе микрофон маңындағы барлық сөйлеуді тыңдауды жалғастырады, бірақ тек кілт сөздер естілгенде ғана әрекет етеді. Хабарлама алу, жазуды бастау немесе команда жіберу үшін "Voice-to-Text" модулінен кейін тиісті реакция модулін қосыңыз.

Біздің мысалда мақсатты модуль ретінде "Preview and Archive" қосылған, сондықтан белгіленген кілт сөздер анықталғанда ол камера ағынын жазуды бастайды және сіз көрсеткен кілт сөз бойынша үзінділерді іздеуге мүмкіндік береді. Бұл мүмкіндікті CSV есебіне сақтау опциясымен оңай біріктіруге болады: ол үшін төмендегі тиісті құсбелгіні белгілеңіз.

"Voice-to-Text" модулінің %VOICE% арнайы макросы бар. Сөйлеу мәтінін жіберу үшін оны "Email Sending", "Application Runner" немесе "HTTP Request Sender" сияқты мақсатты модульдерде қолдана аласыз.

 

СЫРТҚЫ БАҒДАРЛАМАЛАРМЕН ИНТЕГРАЦИЯ

Xeoma Voice-to-Text модулін сыртқы бағдарламаларда да қолдануға болады — мысалы, VoIP әңгімелерін мәтінге айналдыру үшін. Төмендегі нұсқаулық бойынша Voice-to-Text-ке декодтау үшін .mp3 файлын жіберіп, нәтижені мәтін түрінде алуға болады. Осылайша, бұл модульді Xeoma немесе камералар орнатылмаған оператор жұмыс станцияларында да пайдалануға болады. Мұны екі тәсілмен жүзеге асыруға болады: Xeoma API арқылы немесе консольдік команданы іске қосу арқылы. Маңызды: тек .mp3 файлдары қолдау көрсетіледі.

1. API. Бірінші тәсіл үшін Xeoma API мен JSON сұраныстарын қолдану қажет. Командалар арқылы қашықтағы немесе жергілікті Xeoma серверіне .mp3 файлын мәтінге айналдыру туралы сұраныс жібере аласыз.

Мысалы:
curl -F "audio_file=@speech.mp3" "http://192.168.0.135:10090/api?login=Administrator&password=123&speech_recognition=recognition&model=large&language=en&denoise=true"

мұндағы
"speech.mp3" орнына компьютеріңіздегі аудиофайлдың жолын жазыңыз;

"192.168.0.135:10090" орнына Voice-to-Text іске қосуға жарамды, жұмыс істеп тұрған Xeoma серверінің IP-мекенжайы мен портын (әдетте 10090) жазыңыз;

"Administrator" мәнін өзгертпеңіз, өйткені бұл тек Xeoma жүйесінің Administrator профилі үшін қолжетімді;

"123" мәнін Xeoma әкімшісі профилінің құпиясөзіне ауыстырыңыз;

"model=large" — тану моделін таңдау параметрі. Нұсқалар туралы жоғарыда толығырақ қараңыз;

“denoise=true” — шуды жою функциясын қосу үшін қолданылады, бұл кейбір жағдайларда тану дәлдігін арттырады;

"en" мәнін транскрипцияланған мәтінді алу қажет тілдің 2-3 таңбалы кодымен (төменде қараңыз) ауыстырыңыз. Егер бұл код Voice-to-Text жүйесі қабылдаған сөйлеу тілінен өзгеше болса, мәтін автоматты түрде сіз көрсеткен тілге аударылады.

Ескерту: Бұл сұраныс файлдың мәтіндік транскрипциясын тікелей консольге немесе сұранысты жіберу үшін пайдаланылатын кез келген құралға шығарады. Транскрипцияны мәтіндік файл ретінде сақтағыңыз келсе, команда соңына ">filename.txt" қосыңыз:

curl -F "audio_file=@speech.mp3" "http://192.168.0.135:10090/api?login=Administrator&password=123&speech_recognition=recognition&model=large&language=en&denoise=true">savetext.txt
мұнда
savetext.txt мәнін транскрипция файлына қажетті атаумен ауыстырыңыз.

 

2. Командаларды іске қосу. Екінші нұсқа тануды API арқылы емес, консольде орындалатын командалар көмегімен жергілікті компьютерде жүзеге асыруға мүмкіндік береді.

Мысалы:

{Path to Xeoma executable file} -speech2text file.mp3;out.log;large;en;denoise

мұнда
"file.mp3" мәнін компьютердегі аудиофайлдың жолымен ауыстырыңыз;

"out.log" мәнін нәтижелік транскрипция мәтіні файлының жолы мен атауымен ауыстырыңыз;

"large" — тану моделін таңдау параметрі. Нұсқалар туралы жоғарыда толығырақ қараңыз;

"en" мәнін транскрипцияланған мәтінді алу қажет тілдің 2-3 таңбалы кодымен (төменде қараңыз) ауыстырыңыз. Егер бұл код Voice-to-Text жүйесі қабылдаған сөйлеу тілінен өзгеше болса, мәтін автоматты түрде сіз көрсеткен тілге аударылады.

“denoise” — шуды жою функциясын қосу үшін қолданылады, бұл кейбір жағдайларда тану дәлдігін арттырады.

Тіл кодтарының тізімі:

“en”: “ағылшын тілі”,
“zh”: “қытай тілі”,
“de”: “неміс тілі”,
“es”: “испан тілі”,
“ru”: “орыс тілі”,
“ko”: “корей тілі”,
“fr”: “француз тілі”,
“ja”: “жапон тілі”,
“pt”: “португал тілі”,
“tr”: “түрік тілі”,
“pl”: “поляк тілі”,
“ca”: “каталан тілі”,
“nl”: “нидерланд тілі”,
“ar”: “араб тілі”,
“sv”: “швед тілі”,
“it”: “итальян тілі”,
“id”: “индонезия тілі”,
“hi”: “хинди тілі”,
“fi”: “фин тілі”,
“vi”: “вьетнам тілі”,
“he”: “еврей тілі”,
“uk”: “украин тілі”,
“el”: “грек тілі”,
“ms”: “малай тілі”,
“cs”: “чех тілі”,
“ro”: “румын тілі”,
“da”: “дат тілі”,
“hu”: “венгр тілі”,
“ta”: “тамил тілі”,
“no”: “норвегия тілі”,
“th”: “тай тілі”,
“ur”: “урду тілі”,
“hr”: “хорват тілі”,
“bg”: “болгар тілі”,
“lt”: “литуан тілі”,
“la”: “латын тілі”,
“mi”: “маори тілі”,
“ml”: “малаялам тілі”,
“cy”: “уэльс тілі”,
“sk”: “словак тілі”,
“te”: “телугу тілі”,
“fa”: “парсы тілі”,
“lv”: “латвия тілі”,
“bn”: “бенгал тілі”,
“sr”: “серб тілі”,
“az”: “әзербайжан тілі”,
“sl”: “словен тілі”,
“kn”: “каннада тілі”,
“et”: “эстон тілі”,
“mk”: “македон тілі”,
“br”: “бретон тілі”,
“eu”: “баск тілі”,
“is”: “исланд тілі”,
“hy”: “армян тілі”,
“ne”: “непал тілі”,
“mn”: “моңғол тілі”,
“bs”: “босния тілі”,
“kk”: “қазақ тілі”,
“sq”: “албан тілі”,
“sw”: “свахили тілі”,
“gl”: “галисия тілі”,
“mr”: “маратхи тілі”,
“pa”: “панджаби тілі”,
“si”: “сингала тілі”,
“km”: “кхмер тілі”,
“sn”: “шона тілі”,
“yo”: “йоруба тілі”,
“so”: “сомали тілі”,
“af”: “африкаанс тілі”,
“oc”: “окситан тілі”,
“ka”: “грузин тілі”,
“be”: “беларусь тілі”,
“tg”: “тәжік тілі”,
“sd”: “синдхи тілі”,
“gu”: “гуджарат тілі”,
“am”: “амхара тілі”,
“yi”: “идиш тілі”,
“lo”: “лаос тілі”,
“uz”: “өзбек тілі”,
“fo”: “фарер тілі”,
“ht”: “гаити креоль тілі”,
“ps”: “пашту тілі”,
“tk”: “түркмен тілі”,
“nn”: “нинорск тілі”,
“mt”: “мальта тілі”,
“sa”: “санскрит тілі”,
“lb”: “люксембург тілі”,
“my”: “мьянма тілі”,
“bo”: “тибет тілі”,
“tl”: “тагалог тілі”,
“mg”: “малагаси тілі”,
“as”: “ассам тілі”,
“tt”: “татар тілі”,
“haw”: “гавай тілі”,
“ln”: “лингала тілі”,
“ha”: “хауса тілі”,
“ba”: “башқұрт тілі”,
“jw”: “яван тілі”,
“su”: “сундунез тілі”,
“yue”: “кантонез тілі”.

 

ҚАЛАЙ ТЕКТЕРУ КЕРЕК

1. Xeoma-ны біздің веб-сайттан жүктеп алып, іске қосыңыз. Xeoma сервері тиісті процессорлы компьютерде жұмыс істеп тұрғанына көз жеткізіңіз.
Сондай-ақ, осы модульмен жұмыс істеу үшін Xeoma-ның Trial нұсқасында жұмыс істеп тұрғанын тексеріңіз немесе Xeoma Pro лицензиясын белсендіріңіз.
2. Камера қосыңыз немесе Xeoma желідегі камераларды автоматты түрде тауып қосқанша күтіңіз. Егер камераға біріктірілмеген бөлек микрофонмен жұмыс істеу қажет болса, «Микрофон» модулін қосып, тиісті дыбыс көзін таңдаңыз.
3. Тізбекке «Voice-to-Text» модулін қосып, оны баптаңыз.
4. Қажет болса, тиісті әрекеттерді (мысалы, архивке жазу, электронды пошта арқылы хабарлама жіберу немесе жеке әрекет) баптау үшін басқа модульдерді қосыңыз.
5. Дайын! Енді Xeoma-ның жоғары деңгейлі интеллектуалды сөйлеуді тану мүмкіндігін қолдана аласыз.

 

Xeoma бейнебақылау бағдарламасының кеңесі *Voice-to-Text модулі тек келесі процессорларда көрсетіледі және жұмыс істейді:

Келесі сериядағы Intel 64-биттік процессорлары:
- 4-ші буыннан бастап Intel Core процессорлары (10-шы және одан кейінгі буындарды қоса алғанда);
- 6-шы буыннан бастап XEON процессорлары;
- «C23», «C25», «C27», «C33», «C35», «C37», «C38», «C39», «P59», «Z34», «Z35», «x5-E39» немесе «x5-E8000» серияларындағы Atom процессорлары;
- Intel Xeon E5-24 сериясы, i5-2450M немесе i7-2600 процессорлары.

Бұл модуль процессор қуатымен жұмыс істей алғанымен, серверде бейнекарта болуы ұсынылады.

 
Xeoma мүмкіндіктері әлдеқайда көп!
Xeoma аудио ағындарды өңдейтін басқа модульдерді де ұсынады:
Микрофон — дыбыс көзі ретінде USB немесе жеке IP микрофонды таңдауға мүмкіндік беретін модуль.
Дыбыс детекторы — аудио ағындарды талдап, дыбыс деңгейі белгіленген шектен асқанда іске қосылатын модуль.
Дыбыс оқиғалары детекторы — көлік сигнализациясы, баланың жылауы, оқ атылуы, айқай, шыны сыну сияқты нақты дыбыстарды тани алатын интеллектуалды модуль.
 

 

Xeoma Voice-to-Text туралы бейнені қараңыз

 

Thermal Camera Data туралы маңызды ұсыныс Басқа мүмкіндік қажет пе? Біз оны әзірлеп, Xeoma-ға ақылы Custom Development ретінде қоса аламыз. Толығырақ

 

 
XEOMA-НЫҢ ТЕГІН СЫНАҚ НҰСҚАСЫ

Xeoma-ны тегін қолданып көріңіз! Төмендегі өрістерге есіміңіз бен лицензия жіберілетін электронды поштаңызды енгізіп, «Xeoma тегін демо-лицензияларын поштаға алу» батырмасын басыңыз.




Жеке деректері бар электронды пошталарды қолданбауға және жеке деректерді басқа жолмен жібермеуге кеңес береміз. Егер мұны істесеңіз, осы форманы жіберу арқылы жеке деректеріңізді өңдеуге келісіміңізді растайсыз
 

 

Сұрақтарыңыз бар ма? Көмек керек пе? Бізбен байланысыңыз! Көмектесуге қуаныштымыз!

2024 жылғы 14 тамыз

Толығырақ оқыңыз:
Xeoma-дағы қосымша модульдер
Xeoma-дағы ЖИ-ге негізделген модульдердің баға тізімі