← Makalelere Dön

Ses-Metin Dönüştürme: Xeoma'nın Konuşma Tanıma için Geliştirilmiş Modülü

Sesi Metne Dönüştür: Xeoma'nın Konuşma Tanıma için Akıllı Modülü

 


YZ destekli Sesi Metne Dönüştür Xeoma video gözetim yazılımının YZ destekli Ses-Metin Dönüştürme modülü, bir kameradan veya harici bir mikrofondan gelen ses akışını 'dinler', konuşmaları algılar ve bunların dökümünü bir CSV raporuna kaydeder veya önizleme ekranına metin olarak yansıtır. Alternatif olarak, modülü belirli kelime veya ifadelere tepki verecek şekilde yapılandırabilirsiniz. Ayrıca .mp3 ses dosyalarıyla (konuşma kayıtları, eğitim videoları vb.) çalışarak konuşmaları metne dönüştürebilir.

Xeoma Ses-Metin Dönüştürme kullanımı özel donanım gerektirmez: Herhangi bir kameradan veya ayrı bir mikrofondan gelen ses akışının yanı sıra standart bilgisayarlar ve grafik kartları yeterlidir.

Xeoma video gözetim programından öneriler Uyarı: Bu modül Xeoma 24.8.12 sürümünden itibaren mevcuttur ve beta aşamasında olduğu için bazı kelimeleri atlayabilir veya tekrarlar içerebilir.

 

 

UYGULAMA SENARYOLARI

Ses-Metin Dönüştürme modülü, çeşitli amaçlar için kullanılabilecek esnek bir araçtır:

  • Çağrı merkezi: Şirket politikasına ve konuşma senaryolarına uyumu denetlemek amacıyla devam eden çağrıların veya kayıtların transkripsiyonu
  • Yaşlı bakımı: Yardım çığlıklarına anında müdahale imkânı
  • Şehir gözetimi: Terörle mücadele kapsamında tehlike arz eden kelimelerin tanınması
  • Ebeveyn kontrolü: Çocuk güvenliğini sağlama, zorbalığa karşı koruma veya dolandırıcılar ve tacizcilerle iletişimi engelleme desteği
  • Polis: Polis memuru ile şüpheli arasındaki konuşmaların dökümünü çıkaran ve tehlikeli durumları tespit eden gövde kameraları çözümleri
  • Bankalar, rehin dükkanları: Fiziksel olarak basılması gerekmeyen panik butonu
  • Araştırma, analiz: Çeşitli kelimelerin kullanım sıklığına dair istatistiklerin arka planda toplanması ve diğer konuşma odaklı araştırmalar
  • Pazarlama: Müşterilerin bir tanıtım kampanyasını tartışıp tartışmadığının, bir banner veya reklama verdikleri tepkinin belirlenmesi vb.
  • Her türlü işletme: Müşteri hizmetleri kalitesinin otomatik denetimi (örneğin, küfürlü kelimelerin tespiti)
  • Filtreleme ve otomasyon: Konuşmalardaki istenmeyen veya yasaklı kelime ve ifadelerin tespiti; tüm konuşmaları dinlemek zorunda kalmadan belirli bölümlerin detaylı incelemeye yönlendirilmesi

Görüldüğü üzere, Xeoma video gözetim yazılımının "Ses-Metin Dönüştürme" aracı çok geniş bir senaryo yelpazesinde kullanılabilir! Yalnızca özel hayat, şehir ve vatandaş güvenliğini ve ticari alandaki güvenliği artırmakla kalmaz, aynı zamanda işletme operasyonlarının optimizasyonuna da katkı sağlar.

 

SES-METİN DÖNÜŞTÜRME MODÜLÜNÜN AVANTAJLARI:
Sesi Metne Dönüştür modülünün avantajları: her türlü ekipman
Özel donanım gerektirmez:
Standart, yaygın olarak bulunan bilgisayarlar ve neredeyse tüm kameralar kullanılabilir.
Sesi Metne Dönüştür modülünün avantajları: esneklik ve evrensellik
Son derece esnek:
Çeşitli tepki seçenekleri, üçüncü taraf sistemlerle entegrasyon.
Sesi Metne Dönüştür modülünün avantajları: gerçek zamanlı anlık işlem
Gerçek zamanlı çalışma:
Gecikme olmaksızın gerçek zamanlı anlık çalışma. Yalnızca yerel bilgisayarınızda çalışır.
Sesi Metne Dönüştür modülünün avantajları: ekonomik fiyat
Ekonomik çözüm:

Modül, Xeoma Pro lisanslarına halihazırda dahildir!

 

NASIL ÇALIŞIR:

Öncelikle, modülün listede yalnızca Xeoma sunucu bileşeni uygun donanım üzerinde çalıştığında göründüğünü belirtmek gerekir. Modülü listede bulamazsanız uygun bir işlemci ve doğru Xeoma sürümünü kullandığınızdan emin olun (modül yalnızca Xeoma Pro sürümünde mevcuttur). Modül bir ses akışı ile çalıştığı için sistem zincirinde bir ses kaynağı bulunmalıdır: İster kameranın dahili mikrofonu, ister harici bir USB veya IP mikrofon.

Örneğin, ses akışının doğrudan IP kameradan geldiğini varsayalım. Bu durumda Xeoma'da şu modül zincirini kullanmanız yeterlidir: "Universal Camera" – "Voice-to-Text" – "Preview and Archive"

Sesi Metne Dönüştür akıllı modülünü içeren zincir örneği

Modül ayarlarını açmak için zincirdeki Ses-Metin simgesine tıklayın. Ses-Metin modülünü kullanmaya başlamanın ilk adımı, modülün çalışması için gereken ek kaynakları indirmektir. Ek kaynak indirme işlemi, modül ayarlarını ilk kez açtığınızda otomatik olarak başlar. İşlem tamamlandığında "İndirme devam ediyor" mesajı kaybolur.

Sesi Metne Dönüştür akıllı modül ayarları

 

Xeoma video gözetim programından öneriler Ek kaynaklar, Ses-Metin modülünün temelini oluşturan yapay zeka veri dizilerini içerir ve FelenaSoft sunucularından talep üzerine indirilir. Tüm CCTV sistemlerinde gerekli olmadıkları için program boyutunu küçük tutmak amacıyla yazılımla birlikte sunulmazlar.

 

Ek kaynakların indirilmesi tamamlandıktan sonra açılan yeni seçenekler, konuşma tanıma için kullanılacak YZ destekli çeşitli ses tanıma modelleri arasından seçim yapmanıza olanak tanır. Her modelin kendine özgü güçlü ve zayıf yönleri vardır; genellikle tanıma doğruluğu ve işlemci yükü açısından farklılık gösterirler. Model boyutu, tanıma kalitesi ve donanım yükü artış sırasına göre geleneksel olarak tiny, base, small, medium, large şeklinde adlandırılırlar.

Sesi Metne Dönüştür akıllı modül ayarları

"Dil" alanında, konuşma dökümünün hangi dilde sunulacağını seçin (konuşmanın kendi dilini belirtmenize gerek yoktur).

Duyulabilir tüm konuşmaları yazıya dökmek isterseniz, doğrudan "Verileri CSV raporuna kaydet" onay kutusuna gidip bunu işaretleyebilirsiniz. Böylece konuşma dökümleri, diskte belirttiğiniz dizindeki bir hesap tablosu dosyasına kaydedilir; bu dosya istatistik sistemleri gibi diğer sistemlere entegre edilebilir.

Ayrıca "Ses-Metin" modülü belirli ifadeleri veya kelimeleri tespit edebilir. Aranacak kelime veya ifadeleri "Tanıma için anahtar kelimeler" alanına girin. Bu işlemden sonra modül, kamera veya mikrofon çevresindeki tüm konuşmaları dinlemeye devam eder ancak yalnızca anahtar kelimeleri duyduğunda tepki verir. Bu durumda bildirim almak, kaydı başlatmak veya bir komut göndermek için "Ses-Metin" modülünden sonra istediğiniz tepki modülünü bağlayın.

Bu örnekte, hedef modül olarak "Önizleme ve Arşiv" modülü bağlıdır; böylece belirlenen anahtar kelimeler tespit edildiğinde kamera akışını kaydetmeye başlar ve belirttiğiniz anahtar kelimeye göre kayıtlar arasında arama yapmanıza olanak tanır. Bu seçenek, CSV raporuna kaydetme seçeneğiyle de kolayca birleştirilebilir: bunun için aşağıdaki ilgili kutuyu işaretleyin.

"Ses-Metin" modülünün, konuşma dökümlerini göndermek istediğinizde "E-posta Gönderimi", "Uygulama Çalıştırıcı" veya "HTTP İstek Gönderici" gibi hedef modüllerde kullanılabilecek %VOICE% şeklinde bir makrosu vardır.

 

HARİCİ PROGRAMLARLA ENTEGRASYON

Xeoma Ses-Metin modülü, VoIP görüşmelerini yazıya dökmek gibi işlemler için harici programlar tarafından da kullanılabilir. Aşağıdaki talimatları izleyerek, Ses-Metin modülüne çözümlemesi için bir .mp3 dosyası gönderbilir ve sonucu metin olarak alabilirsiniz. Böylece bu modül, Xeoma veya kameraların bulunmadığı operatör iş istasyonlarında bile kullanılabilir. Bu işlem iki şekilde gerçekleştirilebilir: Xeoma API üzerinden veya bir konsol komutu çalıştırarak. Önemli: yalnızca .mp3 dosyaları desteklenir.

1. API. İlk seçenek için JSON istekleri ile Xeoma API kullanmanız gerekir. Komutlar aracılığıyla, uzak veya yerel bir Xeoma sunucusuna bir .mp3 dosyasını metne dönüştürmesi için istek gönderebilirsiniz.

Örneğin:
curl -F "audio_file=@speech.mp3" "http://192.168.0.135:10090/api?login=Administrator&password=123&speech_recognition=recognition&model=large&language=en&denoise=true"

burada
“speech.mp3” ifadesi bilgisayarınızdaki ses dosyasının yoluyla değiştirilmelidir;

“192.168.0.135:10090” ifadesi, Ses-Metin modülünü çalıştırmaya uygun, aktif bir Xeoma sunucusunun IP adresi ve portuyla (genellikle 10090) değiştirilmelidir;

“Administrator” ifadesi olduğu gibi bırakılmalıdır, çünkü bu işlem yalnızca Xeoma Yönetici profili için geçerlidir;

"123" ifadesini Xeoma Yönetici profilinin parolasıyla değiştirin;

"model=large" parametresiyle tanıma modelini seçersiniz. Seçenekler hakkında daha fazla bilgiyi yukarıda bulabilirsiniz;

"denoise=true" ifadesi, bazı durumlarda tanıma doğruluğunu artırabilen gürültü azaltma özelliğini etkinleştirmek için eklenir;

"en" ifadesini, transkripsiyon metnini almak istediğiniz dilin 2-3 karakterlik koduyla (aşağıya bakınız) değiştirin. Bu kod, Ses-Metin özelliğinin dinlediği konuşma dilinden farklıysa metin otomatik olarak belirttiğiniz dile çevrilir.

Not: Bu istek, dosyanın metin transkripsiyonunu doğrudan konsola veya isteği göndermek için kullandığınız araca döndürür. Transkripsiyonu bir metin dosyası olarak kaydetmek isterseniz komutun sonuna ">dosyaadi.txt" ekleyin:

curl -F "audio_file=@speech.mp3" "http://192.168.0.135:10090/api?login=Administrator&password=123&speech_recognition=recognition&model=large&language=en&denoise=true">savetext.txt
burada
savetext.txt ifadesini, transkripsiyon dosyasına vermek istediğiniz isimle değiştirin.

 

2. Komutu çalıştırın. İkinci seçenek, tanıma işlemini API üzerinden değil, konsolda yürütebileceğiniz komutlar aracılığıyla yerel olarak bilgisayarda gerçekleştirmenizi sağlar.

Örnek:

{Path to Xeoma executable file} -speech2text file.mp3;out.log;large;en;denoise

burada
"file.mp3" ifadesini, bilgisayarınızdaki ses dosyasının yoluyla değiştirin;

"out.log" ifadesini, oluşturulacak transkripsiyon metin dosyasının yolu ve adıyla değiştirin;

"large" parametresiyle tanıma modelini seçersiniz. Seçenekler hakkında daha fazla bilgiyi yukarıda bulabilirsiniz;

"en" ifadesini, transkripsiyon metnini almak istediğiniz dilin 2-3 karakterlik koduyla (aşağıya bakınız) değiştirin. Bu kod, Ses-Metin özelliğinin dinlediği konuşma dilinden farklıysa metin otomatik olarak belirttiğiniz dile çevrilir.

"denoise" ifadesi, bazı durumlarda tanıma doğruluğunu artırabilen gürültü azaltma özelliğini etkinleştirmek için eklenir.

Dil kodları listesi:

"en": "İngilizce",
"zh": "Çince",
"de": "Almanca",
"es": "İspanyolca",
"ru": "Rusça",
"ko": "Korece",
"fr": "Fransızca",
"ja": "Japonca",
"pt": "Portekizce",
"tr": "Türkçe",
"pl": "Lehçe",
"ca": "Katalanca",
"nl": "Flemenkçe",
"ar": "Arapça",
"sv": "İsveççe",
"it": "İtalyanca",
"id": "Endonezce",
"hi": "Hintçe",
"fi": "Fince",
"vi": "Vietnamca",
"he": "İbranice",
"uk": "Ukraynaca",
"el": "Yunanca",
"ms": "Malayca",
"cs": "Çekçe",
"ro": "Romence",
"da": "Danca",
"hu": "Macarca",
"ta": "Tamilce",
"no": "Norveççe",
"th": "Tayca",
"ur": "Urduca",
"hr": "Hırvatça",
"bg": "Bulgarca",
"lt": "Litvanca",
"la": "Latince",
"mi": "Maorice",
"ml": "Malayalamca",
"cy": "Galce",
"sk": "Slovakça",
"te": "Teluguca",
"fa": "Farsça",
"lv": "Letonca",
"bn": "Bengalce",
"sr": "Sırpça",
"az": "Azerice",
"sl": "Slovence",
"kn": "Kannadaca",
"et": "Estonca",
"mk": "Makedonca",
"br": "Bretonca",
"eu": "Baskça",
"is": "İzlandaca",
"hy": "Ermenice",
"ne": "Nepalce",
"mn": "Moğolca",
"bs": "Boşnakça",
"kk": "Kazakça",
"sq": "Arnavutça",
"sw": "Svahili",
"gl": "Galiçyaca",
"mr": "Marathice",
"pa": "Pencapça",
"si": "Sinhala",
"km": "Kmerce",
"sn": "Shonaca",
"yo": "Yorubaca",
"so": "Somalice",
"af": "Afrikaans",
"oc": "Oksitanca",
"ka": "Gürcüce",
"be": "Belarusça",
"tg": "Tacikçe",
"sd": "Sindhice",
"gu": "Guceratça",
"am": "Amharca",
"yi": "Yidiş",
"lo": "Laoca",
"uz": "Özbekçe",
"fo": "Faroece",
"ht": "Haiti Kreolcesi",
"ps": "Peştuca",
"tk": "Türkmence",
"nn": "Nynorsk",
"mt": "Maltaca",
"sa": "Sanskritçe",
"lb": "Lüksemburgca",
"my": "Birmanca",
"bo": "Tibetçe",
"tl": "Tagalogca",
"mg": "Malgaşça",
"as": "Assamca",
"tt": "Tatarca",
"haw": "Hawaii Dili",
"ln": "Lingalaca",
"ha": "Hausaca",
"ba": "Başkurtça",
"jw": "Cavaca",
"su": "Sundaca",
"yue": "Kantonca".

 

NASIL TEST EDİLİR

1. Xeoma'yı web sitemizden indirin ve başlatın. Xeoma sunucu bileşeninin gerekli işlemciye sahip bir makinede çalıştığından emin olun.
Ayrıca, bu modülü kullanabilmek için Xeoma'nın Deneme sürümünde çalıştığından emin olun veya bir Xeoma Pro lisansı etkinleştirin.
2. Bir kamera ekleyin veya Xeoma'nın ağınızdaki kameraları otomatik olarak bulmasını bekleyin. Kameraya entegre olmayan ayrı bir mikrofonla çalışmanız gerekiyorsa, “Mikrofon” modülünü bağlayın ve uygun ses kaynağını seçin.
3. Zincire “Sesi Metne Dönüştür” modülünü ekleyin ve yapılandırın.
4. Gerekirse; arşiv kaydı, e-posta gönderimi veya özel tepkiler gibi gerekli aksiyonları tanımlamak için diğer modülleri ekleyin.
5. Tamamlandı! Artık Xeoma’nın üstün yapay zeka tabanlı konuşma tanıma özelliğini kullanabilirsiniz.

 

Xeoma video gözetim programından öneriler *Sesi Metne Dönüştür modülü yalnızca şu işlemcilerde görünür ve çalışır:

Aşağıdaki serilere ait Intel 64-bit işlemciler:
-4. nesil ve üzeri (10+ nesiller dahil) Intel Core işlemciler;
-6. nesil ve üzeri XEON işlemciler;
-“C23”, “C25”, “C27”, “C33”, “C35”, “C37”, “C38”, “C39”, “P59”, “Z34”, “Z35”, “x5-E39” veya “x5-E8000” serisi Atom işlemciler;
-Intel Xeon E5-24 serisi, i5-2450M veya i7-2600 işlemciler.

Bu modül CPU kapasitesiyle çalışabilse de, sunucu makinede bir görüntü işleme kartı (GPU) bulunması önerilir.

 
Xeoma'da dahası da var!
Xeoma, ses akışlarını işleyen diğer modülleri de sunar:
Mikrofon, ses kaynağı olarak USB mikrofon veya harici IP mikrofon seçmenizi sağlayan modüldür.
Ses Dedektörü, ses akışlarını analiz eden ve ses seviyesi belirlenen sınırı aştığında tetiklenen modüldür.
Ses Olayları Dedektörü; araç alarmları, çocuk ağlaması, silah sesleri, çığlıklar ve cam kırılması gibi belirli sesleri tanıyabilen akıllı bir modüldür.
 

 

Xeoma Sesi Metne Dönüştür videosunu izleyin

 

Termal Kamera Verileri hakkında önemli ipucu Başka bir şeye mi ihtiyacınız var? Bunu geliştirip Xeoma'ya ücretli özel geliştirme olarak ekleyebiliriz. Detayları inceleyin

 

 
XEOMA ÜCRETSİZ DENEME

Xeoma'yı ücretsiz deneyin! Aşağıdaki alanlara adınızı ve lisansın gönderileceği e-posta adresinizi girin, ardından 'E-postaya ücretsiz Xeoma demo lisanslarını gönder' düğmesine tıklayın.




Kişisel veri içeren e-postalar kullanmamanızı ve bize herhangi bir yolla kişisel veri göndermemenizi rica ederiz. Buna rağmen gönderim yapmanız halinde, bu formu göndererek kişisel verilerinizin işlenmesine açık rıza gösterdiğinizi beyan etmiş olursunuz
 

 

Sorunuz mu var? Yardıma mı ihtiyacınız var? Lütfen bizimle iletişime geçin! Size yardımcı olmaktan mutluluk duyarız!

14 Ağustos 2024

Devamını okuyun:
Xeoma'daki ek modüller
Xeoma'daki YZ tabanlı modüllerin fiyat listesi