PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Systemy komunikacji głosowej w języku naturalnym oparte na wolnym oprogramowaniu

Identyfikatory
Warianty tytułu
EN
Natural language voice communication systems based on open software
Języki publikacji
PL
Abstrakty
PL
Zdolność komunikacji głosowej w języku naturalnym jest jednym z podstawowych elementów funkcjonalności robotów społecznych. Istniejące technologie, a także gotowe rozwiązania programowe do jej realizacji są jednymi z wątków tej pracy. Omówione będą elementy architektury i budowa antropomorficznego agenta do komunikacji głosowej (ASDA). Innym wątkiem są otwarte standardy i wolne oprogramowanie, zyskujące coraz większe znaczenie na rynku oprogramowania oraz w konstrukcji złożonych systemów, między innymi ze względu na rosnące znaczenie bezpieczeństwa oprogramowania.
EN
The voice natural language communication capability is one of the essential features of social robots. The existing technologies, and complete software solutions for its creation is one of the topics of this work. Discussed are the architecture of an anthropomorphic spoken dialog agent (ASDA) and its elements. Another topic is open standards and open software, claiming a significant share of the general software market, and also gaining attention in the technology of building complex systems, in part due to the increasing software risks and safety concerns.
Rocznik
Strony
671--680
Opis fizyczny
Bibliogr. 31 poz., rys.
Twórcy
autor
Bibliografia
  • [1] D. Jurafsky & J. Martin: Speech and language processing, 2nd ed., 2008.
  • [2] M. Kubanek: Metoda rozpoznawania audio-wideo mowy polskiej w oparciu o ukryte modele Markowa, praca doktorska, Politechnika Częstochowska, 2005.
  • [3] H. Alshawi: The Core Language Engine, MIT Press, 1992.
  • [4] R. Schwartz i in.: Language Understanding Using Hidden Understanding Models, BBN System & Technology Corp., Cambridge, 1996. http://ieeexplore.ieee.org/iel3/4822/13324/00607771.pdf?arnumber=607771
  • [5] L. Osowski: Budujemy własny syntezator mowy, Software 2.0, nr 2/2003, s. 26-35.
  • [6] Festival http://www.cstr.ed.ac.uk/projects/festival/
  • [7] MBROLA, TCTS http://tcts.fpms.ac.be/synthesis/mbrola.html
  • [8] S. Kawamoto i in.: Open-source Software for Developing Anthropomorphic Spoken Dialog Agents, 2003 http://www.cstr.ed.ac.uk/downloads/publications/2003/Kawamoto2003Book.pdf
  • [9] Robot GRACE, Carnegie Mellon University, Naval Research Laboratory, Northwestern University, Metrica Inc., Swarthmore College, USA http ://www.ri.cmu.edu/projects/project_522.html
  • [10] Robot MDS, MIT, USA, http://robotic.media.mit.edu
  • [11] Robot ALBERT, Hanson Robotics, USA, http://www.hansonrobotics.com
  • [12] AIML, A.L.I.C.E Artificial Intelligence Foundation, http://www.alicebot.org/
  • [13] D. Oliver, Universität des Saarlandes, http://www.coli.uni-saarland.de/~dominika/research.phtml
  • [14] VoiceXML http://www.w3.org/TR/voicexml20/
  • [15] X+V http://www. voicexml. org/specs/multimodal/x+v/12/
  • [16] Opera & X+V http://www.opera.com/products/desktop/voice/
  • [17] JSAPI, SUN Microsystems http://java.sun.com/products/java-media/speech/
  • [18] SAPI, Microsoft http://www.microsoft.com/speech
  • [19] CSLU Toolkit, Center for Spoken Language Understanding, Oregon Graduate Institute of Science and Technology http://www.cslu.ogi.edu/toolkit/
  • [20] ISIP-LVCSR, ISIP http://www.ece.msstate.edu/research/isip/projects/speech/index.html
  • [21] CMU Sphinx, CMU http://cmusphinx.sourceforge.net/html/cmusphinx.php
  • [22] Dragon NaturallySpeaking 9, Nuance, USA http://www.nuance.com/naturallyspeaking/
  • [23] IVONA, IVO, Polska http://www.ivo.pl/
  • [24] Baldi, Perceptual Sciences Laboratory at University of California, Santa Cruz http://mambo.ucsc.edu/index.html
  • [25] OpenVXI 3.0, CMU: http://www.speech.cs.cmu.edu/openvxi/index.html
  • [26] G. Jagodziński: Gramatyka języka polskiego, fonemy polskie, 2008 http://free.of.pl/g/grzegorj/gram/fonemy3.html
  • [27] P. Mrówka: Sympozjum Sztuczna inteligencja - innowacyjne rozwiązania, NEU-ROSOFT, Politechnika Wrocławska, 16 maja 2008, http://www.neurosoft.pl/
  • [28] K. Szklanny: Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA, praca magisterska, PJWSTK, Warszawa, 2002 http://www.syntezamowy.pjwstk.edu.pl/download/mgrlast08_2002.zip
  • [29] P. Ślepko: Analiza i synteza mowy polskiej z wykorzystaniem pakietów wolnego oprogramowania - Rozmowa wg scenariusza, praca magisterska, Politechnika Wrocławska, 2008.
  • [30] CSLP Interdyscyplinarne Centrum Przetwarzania Mowy i Języka, UAM, Poznań http://ifa.amu.edu.pl/cslp/pl/news.html
  • [31] S. Grocholewski: Podstawy systemu rozpoznawania mowy dla języka polskiego, Politechnika Poznańska, http://www.zsi.pwr.wroc.pl/zsi/missi2002/pdf/s101.pdf
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-PWA9-0031-0030
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.