Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!
  • Sesja wygasła!
  • Sesja wygasła!

Znaleziono wyników: 2

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  Unicode
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
With the establishment of commercial OCR systems for Latin text, recent research efforts have been directed at the design of recognition systems for non-Latin scripts, such as Japanese, Cyrillic, Chinese, Hindi, Tibetan, and in particular Arabic. The Unicode 4.0 standard supports 50 scripts that are used across the world, and many, such as Amharic (Ethiopic), have attracted virtually no attention from researchers. An extensive literature review reveals no papers which report on an OCR system for Amharic. This paper describes a normalised technique which can be used for recognition of isolated Arabic, Amharic and Latin characters. Two approaches are considered for identifying the characters by comparing them to a series of templates and using a signature template scheme. The degrees of similarity between pairs of Amharic, Arabic and typical Latin characters are presented in the confusion matrix, and the performance of the two approaches is compared for each of these three character sets.
2
Content available remote Multilingual European subset of Unicode in geospatial data encoding
PL
Większość problemów dotyczących infrastruktur geoinformacyjnych w zakresie technologii, architektury i modeli danych jest taka sama, niezależnie od regionu świata, dla którego infrastruktura jest budowana. Z tego powodu potrzeba opracowania ogólnoświatowych standardów w tym zakresie (ISO, 2004) jest faktem, który nie budzi niczyich zastrzeżeń. Jednak część tych problemów ma charakter regionalny i w międzynarodowych standardach może być ujęta jedynie w formie zaleceń. Do tej grupy należą zagadnienia kulturowe poszczególnych krajów, a w tym językowe i prawne. Europa wyróżnia się szczególną różnorodnością kulturową. W 46 krajach europejskich jest obecnie używanych ponad 205 języków (SIL, 2003). Publikacja Eversona (Everson, 2002) zawiera zbiór 165 alfabetów używanych w Europie. Założenia technologiczne Europejskiej Infrastruktury Geoinformacyjnej (ESDI) muszą uwzględniać tą różnorodność, ponieważ brak możliwości jednoczesnego i zarazem jednoznacznego kodowania znaków różnych europejskich alfabetów utrudni interpretacje geoinformacji i przez to znacznie ograniczy jej użyteczność. W szczególności zagadnienie to dotyczy nazw geograficznych małych, ale za to bardzo licznych miejscowości, które nie mają swoich odpowiedników w innych językach. Przykładem może być podróż przez Europę ze szwedzkiego miasta Gratrask do miejscowości położonej w pobliżu Jerozolimy, której głównymi punktami są miejscowości: (miasto w Okręgu Kaliningradzkim), Zbąszyń, Żagań i Łódź. (miasta w Polsce), miejscowość w pobliżu Aten ( ) i Kecioren (miasto w Turcji). Autorzy podstaw koncepcji ESDI rozwijanej w inicjatywie INSPIRE doceniają wagę problemów wielojęzyczności społeczeństw europejskich. Przykładem tego jest fragment jednego z dokumentów inicjatywy INSPIRE (INSPIRE-AST WG, 2002): "Aspekty wielojęzyczności są związane z prawie wszystkimi zagadnieniami funkcjonalności. Dotyczą one zapytań o metadane, przeglądania informacji geoprzestrzennej (nazwy miejscowości, objaśnień) i wyników wszelkich analiz (np. wyszukiwania zbiorów danych). Uwzględnienie wielojęzyczności w projekcie INSPIRE jest koniecznością. Z tych powodów autor przeprowadził analizę moźliwości zastosowania Unicode w ESDI ze szczególnym uwzględnieniem nazw geograficznych. Między innymi został przeprowadzony eksperyment testowy dotyczący znajdowania przy pomocy wyszukiwarki Google informacji związanych z nazwami geograficznych zapisanych w Unicode na mapie umieszczonej na stronie WWW.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.