Systemy komunikacji głosowej w języku naturalnym oparte na wolnym oprogramowaniu

Paluszyński, P.; Ślepko, P.

Artykuł - szczegóły

Tytuł artykułu

Systemy komunikacji głosowej w języku naturalnym oparte na wolnym oprogramowaniu

Autorzy

Paluszyński P. , Ślepko P.

Identyfikatory

Warianty tytułu

Natural language voice communication systems based on open software

Języki publikacji

Abstrakty

Zdolność komunikacji głosowej w języku naturalnym jest jednym z podstawowych elementów funkcjonalności robotów społecznych. Istniejące technologie, a także gotowe rozwiązania programowe do jej realizacji są jednymi z wątków tej pracy. Omówione będą elementy architektury i budowa antropomorficznego agenta do komunikacji głosowej (ASDA). Innym wątkiem są otwarte standardy i wolne oprogramowanie, zyskujące coraz większe znaczenie na rynku oprogramowania oraz w konstrukcji złożonych systemów, między innymi ze względu na rosnące znaczenie bezpieczeństwa oprogramowania.

The voice natural language communication capability is one of the essential features of social robots. The existing technologies, and complete software solutions for its creation is one of the topics of this work. Discussed are the architecture of an anthropomorphic spoken dialog agent (ASDA) and its elements. Another topic is open standards and open software, claiming a significant share of the general software market, and also gaining attention in the technology of building complex systems, in part due to the increasing software risks and safety concerns.

Słowa kluczowe

robotyka roboty inteligentne roboty społeczne komunikacja głosowa język naturalny

robotics intelligent robot social robots voice communication natural language

Wydawca

Oficyna Wydawnicza Politechniki Warszawskiej

Czasopismo

Prace Naukowe Politechniki Warszawskiej. Elektronika

Rocznik

2008

Tom

z. 166, t. 2

Strony

671--680

Opis fizyczny

Bibliogr. 31 poz., rys.

Twórcy

autor

Paluszyński P.

autor

Ślepko P.

Instytut Informatyki, Automatyki i Robotyki, Politechnika Wrocławska, Wybrzeże Wyspiańskiego, 50-370 Wrocław, witold.paluszynski@pwr.wroc.pl

Bibliografia

[1] D. Jurafsky & J. Martin: Speech and language processing, 2nd ed., 2008.
[2] M. Kubanek: Metoda rozpoznawania audio-wideo mowy polskiej w oparciu o ukryte modele Markowa, praca doktorska, Politechnika Częstochowska, 2005.
[3] H. Alshawi: The Core Language Engine, MIT Press, 1992.
[4] R. Schwartz i in.: Language Understanding Using Hidden Understanding Models, BBN System & Technology Corp., Cambridge, 1996. http://ieeexplore.ieee.org/iel3/4822/13324/00607771.pdf?arnumber=607771
[5] L. Osowski: Budujemy własny syntezator mowy, Software 2.0, nr 2/2003, s. 26-35.
[6] Festival http://www.cstr.ed.ac.uk/projects/festival/
[7] MBROLA, TCTS http://tcts.fpms.ac.be/synthesis/mbrola.html
[8] S. Kawamoto i in.: Open-source Software for Developing Anthropomorphic Spoken Dialog Agents, 2003 http://www.cstr.ed.ac.uk/downloads/publications/2003/Kawamoto2003Book.pdf
[9] Robot GRACE, Carnegie Mellon University, Naval Research Laboratory, Northwestern University, Metrica Inc., Swarthmore College, USA http ://www.ri.cmu.edu/projects/project_522.html
[10] Robot MDS, MIT, USA, http://robotic.media.mit.edu
[11] Robot ALBERT, Hanson Robotics, USA, http://www.hansonrobotics.com
[12] AIML, A.L.I.C.E Artificial Intelligence Foundation, http://www.alicebot.org/
[13] D. Oliver, Universität des Saarlandes, http://www.coli.uni-saarland.de/~dominika/research.phtml
[14] VoiceXML http://www.w3.org/TR/voicexml20/
[15] X+V http://www. voicexml. org/specs/multimodal/x+v/12/
[16] Opera & X+V http://www.opera.com/products/desktop/voice/
[17] JSAPI, SUN Microsystems http://java.sun.com/products/java-media/speech/
[18] SAPI, Microsoft http://www.microsoft.com/speech
[19] CSLU Toolkit, Center for Spoken Language Understanding, Oregon Graduate Institute of Science and Technology http://www.cslu.ogi.edu/toolkit/
[20] ISIP-LVCSR, ISIP http://www.ece.msstate.edu/research/isip/projects/speech/index.html
[21] CMU Sphinx, CMU http://cmusphinx.sourceforge.net/html/cmusphinx.php
[22] Dragon NaturallySpeaking 9, Nuance, USA http://www.nuance.com/naturallyspeaking/
[23] IVONA, IVO, Polska http://www.ivo.pl/
[24] Baldi, Perceptual Sciences Laboratory at University of California, Santa Cruz http://mambo.ucsc.edu/index.html
[25] OpenVXI 3.0, CMU: http://www.speech.cs.cmu.edu/openvxi/index.html
[26] G. Jagodziński: Gramatyka języka polskiego, fonemy polskie, 2008 http://free.of.pl/g/grzegorj/gram/fonemy3.html
[27] P. Mrówka: Sympozjum Sztuczna inteligencja - innowacyjne rozwiązania, NEU-ROSOFT, Politechnika Wrocławska, 16 maja 2008, http://www.neurosoft.pl/
[28] K. Szklanny: Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA, praca magisterska, PJWSTK, Warszawa, 2002 http://www.syntezamowy.pjwstk.edu.pl/download/mgrlast08_2002.zip
[29] P. Ślepko: Analiza i synteza mowy polskiej z wykorzystaniem pakietów wolnego oprogramowania - Rozmowa wg scenariusza, praca magisterska, Politechnika Wrocławska, 2008.
[30] CSLP Interdyscyplinarne Centrum Przetwarzania Mowy i Języka, UAM, Poznań http://ifa.amu.edu.pl/cslp/pl/news.html
[31] S. Grocholewski: Podstawy systemu rozpoznawania mowy dla języka polskiego, Politechnika Poznańska, http://www.zsi.pwr.wroc.pl/zsi/missi2002/pdf/s101.pdf

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-PWA9-0031-0030