<<< [=]

2 Historio de maŝina tradukado (MT)

2.4 Kompreno de tekstoj, AI

2 Geschichte der Maschinellen Übersetzung (MÜ)

2.4 Textverstehen, KI

Kvankam la sintaksa aliro unue progresigis la kampon de MT, pli kaj pli montriĝis, ke pure sintaksa analizo ne povas doni la kompletan enhavan strukturon de frazoj. Eĉ pli grava estis la problemo, ke sintakso nur malmulton diras pri rilatoj inter sinsekvaj frazoj.

Obwohl der syntaktische Ansatz zuerst Fortschritte auf dem Gebiet der MÜ brachte, zeigte es sich mehr und mehr, dass eine rein syntaktische Analyse keine vollständige inhaltliche Struktur eines Satzes liefern kann. Noch schwerwiegender war das Problem, dass die Syntax nur wenig über Beziehungen zwischen aufeinanderfolgenden Sätzen sagen kann.

Meze de la 1960-aj jaroj konkretiĝis la fakto, ke tiuj problemoj de MT ne estas solveblaj per sintaksa analizo. La agnosko de tiu fakto esprimiĝis en 1966 en la fama "publikaĵo 1416" de la Usona Nacia Esplor-Konsilio (National Research Council) kaj ties Konsila Komitato pri Aŭtomata Lingvo-Prilaborado (Automatic Language Processing Advisory Committee, ALPAC), kiu konstatis, ke maŝina tradukado estas nefarebla en antaŭvidebla tempo, kaj rekomendis ne subvencii koncernajn esplorojn. Tiu publikaĵo, mallonge nomita "ALPAC-raporto", finis la optimisman periodon de MT.

Mitte der 1960er Jahre verdichtete sich die Erkenntnis, dass diese Probleme der MÜ nicht durch syntaktische Analyse lösbar seien. Die Anerkennung dieser Tatsache drückte sich 1966 in der berühmten "Veröffentlichung 1416" des US-Amerikanischen Nationalen Forschungsrates (National Research Council) und dessen Beratenden Ausschusses für automatische Sprachverarbeitung (Automatic Language Processing Advisory Committee, ALPAC), aus, die feststellte, dass maschinelle Übersetzung in der vorhersehbaren Zukunft nicht machbar sei, und empfahl, entsprechende Forschungen nicht finanziell zu unterstützen. Diese Veröffentlichung, kurz "ALPAC-Bericht" genannt, beendete die optimistische Periode der MÜ.

La esploroj pri traktado de naturaj lingvoj tiam koncentriĝis pri aŭtomata kompreno. Kompreno estas procezo, kiu postulas certan inteligentecon kaj kies funkciado estis preskaŭ nekonata; tial koncernaj esploroj estas parto de la "Artefarita Inteligenteco" (AI).

Kompreno de tekstoj estas utila en multaj kampoj, ekzemple por sistemoj, kiuj dialogas kun homoj (aŭtomataj informiloj pri horaroj, aŭtomata telefona mendado de varoj, serĉado en datenbanko, ktp.). Sed ankaŭ koncerne MT disvastiĝis la konvinko, ke ĝi estas neebla sen almenaŭ iugrada kompreno, do la MT-esploroj interesiĝis pri esploroj de tiu direkto.

Die Forschungen zur Sprachverarbeitung konzentrierten sich nun auf das automatische Verstehen. Verstehen ist ein Prozess, der Intelligenz voraussetzt und dessen Funktionsweise nahezu unbekannt war; die einschlägigen Forschungen gehören daher zur "Künstlichen Intelligenz" (KI).

Textverstehen ist in vielen Bereichen nützlich, zum Beispiel für Systeme, die einen Dialog mit Menschen führen (automatische Fahrplanauskunft, automatische telefonische Warenbestellung, Suche in Datenbanken, usw.). Aber auch bezüglich der MÜ verbreitete sich die Überzeugung, dass sie ohne wenigstens ein gewisses Verständnis nicht möglich sei; daher interessierte sich die MÜ auch für Forschungen in dieser Richtung.

Detala priskribo de la teknikoj de lingvo-kompreno transirus la kadron de tiu ĉi kurso. Ili estas multaj; kelkaj eliras de la lingva flanko, aliaj de la mondo priparolata en lingvoj. Ligas la du flankojn la fakto, ke la homaj lingvoj kaj kompren-mekanismo evoluis dum jarmilionoj en kaj laŭ la mondo, pri kiu parolas la lingvoj.

Eine detaillierte Beschreibung der Techniken des Sprach-Verstehens würde den Rahmen dieses Kurses sprengen. Es gibt eine Vielzahl davon; einige gehen von der sprachlichen Seite aus, andere von der Welt, über die die Sprachen sprechen. Verbunden werden diese beiden Seiten durch die Tatsache, dass sich die menschlichen Sprachen und der Mechanismus ihres Verstehens in Jahrmillionen innerhalb und an der Welt entwickelt haben, über die diese Sprachen sprechen.

Grava aliro de la lingva flanko estas sistemoj de "kazo-gramatikoj". Multaj naturaj lingvoj uzas kazojn por esprimi rilatojn inter propozicioj. La latin-baza gramatiko eĉ klopodis nomi tiajn kazojn laŭ iliaj funkcioj, ekzemple:

  • nominativo (lat. nominare = nomi): baza kazo, en kiu oni listigas substantivojn; kazo por la subjekto de frazo.
  • genitivo (lat. generare = produkti): kazo de la fonto, aparteno.
  • dativo (lat. dare = doni): kazo de la celo de ago.
  • akuzativo (lat. accusare = akuzi): kazo de la objekto de ago.
  • vokativo (lat. vocare = voki): kazo de la alparolo.
  • ablativo (lat. auferre, participo ablatum = forpreni): kazo de la forigo.
  • lokativo (lat. locus = loko): kazo de la loko.
  • ergativo (lat. erga = [amike] al): kazo de bonintenca celo.
  • instrumentalo: kazo de rimedo aŭ instrumento de la ago.
  • ktp.

Pure gramatikaj kazoj laŭ la speco de "prepozitivo", kiuj ne estas atribueblaj al enhava funkcio, ne apartenas al tiu kategorio.

Ein wichtiger Ansatz von der sprachlichen Seite her sind Systeme von "Fall-Grammatiken". Viele natürliche Sprachen verwenden "Fälle", um Beziehungen zwischen Satzteilen auszudrücken. Die Grammatik lateinischer Tradition benannte diese Fälle möglichst nach ihren Funktionen, zum Beispiel:

  • Nominativ (lat. nominare = nennen): Grundfall, in dem Substantive aufgeführt werden; Subjektfall.
  • Genitiv (lat. generare = erzeugen): Herkunftsfall, Besitzfall.
  • Dativ (lat. dare = geben): Fall für das Ziel einer Handlung.
  • Akkusativ (lat. accusare = anklagen): kazo de la objekto de ago.
  • Vokativ (lat. vocare = rufen): Anredefall.
  • Ablativ (lat. auferre, Partizip ablatum = wegtragen): Fall des Entfernens.
  • Lokativ (lat. locus = Ort): Fall der Ortsangabe.
  • Ergativ (lat. erga = [freundlich] zu): Fall der freundschaftlichen Zuwendung.
  • Instrumental: Fall des Hilfsmittels einer Handlung.
  • usw.

Rein grammatikalische Fälle nach der Art eines "Präpositivs", die keiner inhaltlichen Funktion zugeordnet werden können, gehören nicht in diese Kategorie.

Per "traduko" de la fonto-lingvaj rilatoj en "universalan" sistemon de tiaj kazoj oni akiras certan komprenon de la fontolingva teksto. Tiun komprenon oni poste traduku en la rilato-sistemon de la cel-lingvo.

Durch "Übersetzung" quellsprachlicher Beziehungen in ein "universelles" System solcher Fälle ergibt sich ein gewisses Verständnis des Quelltextes. Dieses Verständnis ist dann in das Beziehungssystem der Zielsprache zu übersetzen.

Je la flanko de la "mondaj" aliroj estas nomeblaj kelkaj eksperimentaj sistemoj, kiuj provis modeli komprenon en "fermitaj mondoj", malgrandaj partoj de la reala mondo, pri kiuj eblas kompleta superrigardo. Tia sistemo estas "Shrdlu", komputila programo de la komencaj 1970aj jaroj, kun kiu eblas Angle dialogi pri mondo konsistanta el konstru-blokoj en la formo de bazaj geometriaj figuroj (brikoj, piramidoj, ktp.). Tiu sistemo ebligis ekzemple studi la funkciojn de pronomoj, kiuj rilatas al vortoj en alia frazo.

Auf der Seite der "Welt"-Ansätze sind experimentelle Systeme zu nennen, die versuchten, das Verstehen anhand "abgeschlossener Welten" zu modellieren, kleiner Teile der realen Welt, über die ein vollständiger Überblick möglich ist. Ein solches System ist "Shrdlu", ein Rechnerprogramm aus den ersten 1970er Jahren, mit dem man sich auf Englisch über eine Welt aus Bauklötzen in Form elementarer geometrischer Figuren (Quader, Pyramiden) unterhalten kann. Dieses System erlaubte es zum Beispiel, die Funktion von Pronomina zu studieren, die sich auf Wörter in anderen Sätzen beziehen.

Pretere, la nomo "Shrdlu" devenas de la sepa ĝis dekdua plej oftaj literoj de la Angla lingvo, kiuj estas en tiu sinsekvo aranĝitaj sur la linotipaj kompostiloj (ETAOINSHRDLU).

Der Name "Shrdlu" leitet sich übrigens von den siebt- bis zwölft-häufigsten Buchstaben der englischen Sprache ab, die in dieser Reihenfolge auf den "Linotype"-Setzmaschinen angeordnet sind (ETAOINSHRDLU).

>>>