Joseph Weizenbaum gewidmet

1. Verstehen – ohne zu lesen?

„A bitstream appears to be the future of information“ hat Michael Seadle in seiner Antrittsvorlesung mit dem Titel „The Work that Vanished“ geendet und zu Recht darauf hingewiesen, dass eine der elementaren Herausforderungen an Bibliotheken – wenn sie denn Bestand haben sollen – eben darin besteht: diesen bitstream mit so viel Bedacht und Methode zu erhalten, dass unsere Zeiten nicht dereinst als die 'dunklen Jahrzehnte' der Moderne erscheinen mögen, aus denen so wenige und fragmentarische Reste von Wissenschaft und Kultur konserviert bleiben könnten wie aus den 'dunklen' Jahrhunderten nach dem Untergang der antiken Kulturen.

Und doch: setzen wir einmal voraus, dass Denken und Forschen der Bibliotheks- und Informationswissenschaft in dem von Michael Seadle geforderten Sinne von Erfolg gekrönt sind. Wir wären dann in der Lage, nicht nur den bitstream zuverlässig zu konservieren, sondern wir wären sogar imstande, dauerhaft Strukturen in diesem bitstream zu erhalten, welche die in ihm verfassten komplexen Kultur- und Informationsobjekte langfristig so zuverlässig in signifikante Unter-Einheiten dekomponierbar machen, wie dies jahrhundertelang die Seitenzählung unserer Bücher und Zeitschriften erlaubt hat. Wir hätten dann gewaltige Akkumulationen von bits, wir verfügten über Strukturen – und doch, so behaupte ich, hätten wir nicht viel in der Hand: denn wer könnte all dies verstehen?

Angesichts von Milliarden und Abermilliarden persistent verfügbarer digitaler Informationsobjekte wird es ja schlicht nicht mehr möglich sein, allein durch 'Lesen' und menschliche, intellektuelle Aktivität diese Informationsmassen gedanklich zu durchdringen – zumindest soweit, dass immerhin eine im jeweils gegebenen Kontext angemessene Auswahl dieser Objekte möglich würde! Und selbst eine solche kompetente Auswahl relevanter Informationsobjekte wäre nicht mehr im konventionellen Sinne lesbar – es sei denn wir würden weite Teile der Menschheit als Bibliothekare Zwangs- und Dauerverpflichten: eine vielleicht gar nicht unattraktive, politisch jedoch wohl kaum durchsetzbare Option.

In seinem Aufsatz „What do you do with a million books?“ hat Greg Crane (2006) das Ausmaß der mit diesem Vorgang verbundenen Herausforderung am Beispiel der Massendigitalisierung durch GoogleBooks angedeutet. Crane bemerkt zu Recht, dass mit den nun gegebenen Technologien und Initiativen nicht nur Millionen digitalisierter Bücher simultan verfügbar werden – diese werden auch durch die Möglichkeiten der maschinellen Erkennung von Binnenstrukturen und beispielsweise Namensentitäten in einer ganz neuen Granularitätsstufe als Aggregationen diskreter Einheiten schon im Retrievalkontext präsent.

Dies war in traditionellen Bibliothekskatalogen undenkbar, in denen ein Katalogisat von wenigen hundert Zeichen eine Informationsmenge von typischerweise einigen Millionen bytes repräsentierte. In der von Crane beschriebenen Beispielsammlung von dreihundert Bänden amerikanischer Literatur des 19. Jahrhunderts mit insgesamt 55 Millionen Wörtern hingegen können schon derzeit gängige Algorithmen der Namenserkennung 12 Millionen diskrete Einheiten automatisch kennzeichnen. Und selbst wenn es sich hier um einen Sonderfall mit einem hohen Anteil historischer Dokumente und Nachschlagewerke handelt, so sind die von Crane beschriebenen Systeme doch in der Lage, auch in beliebigen Buchobjekten immerhin jeweils tausende Namensentitäten zu erkennen.

Die Anzahl der diskreten, digital prozessierbaren und semantisch unterscheidbaren Einheiten steigt also durch Zuwachs in der Masse und zugleich drastisch gesteigerte Granularität gleich um mehrere Größenordnungen. Angesichts dessen benötigen wir neue Werkzeuge, um große Mengen digitaler Informationsobjekte einschließlich ihrer Konstituenten gedanklich zu organisieren und können dabei nicht mehr auf das althergebrachte bibliothekarische Katalogparadigma zurückgreifen. Wir müssen Mittel finden, bislang unvorstellbare Aggregationen strukturierter digitaler Informationen zu verstehen oder zumindest verstehbar zu machen. Dies ist der zu Michael Seadles Botschaft komplementäre Imperativ: sicherstellen, dass das hoffentlich nicht verschwundene Werk auch noch verstanden werden kann, und zwar unter den Bedingungen digitaler, netzbasierter Informationsorganisation!

Wir müssen also – dies meine erste These – imstande sein, digitale Informationsobjekte zu verstehen, ohne sie sämtlich zu lesen!

Und um diesem Zauberwort 'Verstehen' näher zu kommen – so das Postulat dieser Vorlesung – müssen wir auch als Informationswissenschaftler neu und gründlich nachdenken über das Verhältnis dreier Ebenen von Digitalität: unterscheiden müssen wir digitale Signale – den bitstream – als Trägermedium von digitalen Informationen auf syntaktischer Ebene und diese wiederum absetzen gegenüber digitalen Zeichen als Bedeutungsträgern auf der semantischen Ebene.

2. Vom Glück des Verstehens: Die Amsel

Wenn man kompetent und wissenschaftlich seriös vom Verstehen sprechen will, vom 'Interpretieren', von der 'Hermeneutik' gar, kommen Jahrtausende philosophischer Tradition ins Spiel, die unmöglich in wenige Minuten zu pressen sind. Da ich nun aber annehmen darf, dass den meisten von Ihnen zumindest gewichtige Aspekte dieses Zentralmotivs meiner Professur (denn was wäre 'Wissen' ohne 'Verstehen'?) ohnehin geläufig sind, gestatten Sie mir statt dessen zur Illustration der gedanklichen Grundfigur meiner Vorlesung einen etwas überraschenden Ausflug in die schöne Literatur. Die Rede ist von Robert Musils Erzählung „Die Amsel“, die ich kursorisch als Parabel des Verstehens lesen möchte. [Fn1]

Im Kern besteht „Die Amsel“ aus drei scheinbar kaum untereinander zusammenhängenden Geschichten, die ein Mann mit dem seltsam abstrakten Namen Azwei seinem Freund Aeins erzählt. Diese Begebenheiten stehen zusammen gesehen an der Grenze zwischen Geräusch und Sprache. An der Grenze also zwischen dem ungegliederten Laut und der Sprache, die in sich different ist und damit Differenzierung möglich macht. Erst Sprache schafft 'Welt' im eigentlichen Sinne, indem sie die ungestaltete Masse der auf einem Menschen hereinbrechenden Eindrücke gliedert und damit begreifbar macht.

Auf der seltsamen Zwischenstufe zwischen beiden Bereichen, von der Musil eine Ahnung zu geben versucht, ist der Zustand der Entropie, in dem sich die Welt vor Einsetzen des sprachgeleiteten Verständnisses darbietet, noch kaum verlassen. Aus dieser Zwischenwelt befreit uns nur der Schlaf - oder eben die Sprache.

In diesem Zustand, einer Art weißes Rauschen der Dinge, in dem er die Welt nicht mehr versteht, befindet sich Azwei zu Beginn der ersten Geschichte. Er hat in seinem Berliner Haus eine durchwachte Nacht hinter sich, ist gerade im Begriff, einzuschlafen – doch dann heiß es: „Es kann mein letzter wacher Eindruck gewesen sein oder ein ruhendes Traumgesicht. Dann wurde ich durch etwas Näherkommendes erweckt; Töne kamen näher.“ (Musil 1928, S. 551)
Und trotz der kurzzeitigen Enttäuschung ob der Tatsache, dass das in der Folge vernommene Klingen nicht – wie zuerst gedacht - das Lied einer Nachtigall, sondern der Ruf einer profanen Amsel war, ist das Fazit dieser durchwachten Abschieds-Nacht „Es hatte mich von irgendwo ein Signal getroffen.“ Dies Signal, der Ruf der Amsel, verändert Azweis Leben, bringt ihn dazu, seine Frau, sein Heim zu verlassen. Auf Wanderschaft. In die Einsamkeit. In den Krieg.
Und aus dem Krieg erzählt er seine zweite Geschichte: die Geschichte vom Fliegerpfeil. Er befindet sich in einer Gebirgsstellung in Norditalien, die eines Tages von einem feindlichen Flugzeug überflogen wird. Und hier beginnt die zweite Begebenheit:

„In diesem Augenblick hörte ich ein leises Klingen, das sich meinem hingerissen emporstarrenden Gesicht näherte […] im gleichen Augenblick wusste ich auch schon: es ist ein Fliegerpfeil. Das waren spitze Eisenstäbe, nicht dicker als ein Zimmermannsblei, welche damals die Flugzeuge aus der Höhe abwarfen; und trafen sie den Schädel so kamen sie wohl erst bei den Fußsohlen wieder heraus, aber sie trafen eben nicht oft, und man hat sie bald wieder aufgegeben. […] Und weißt du, wie das war? Nicht wie eine schreckliche Ahnung, sondern wie ein noch nie erwartetes Glück. […] Es war ein dünner, singender, einfacher hoher Laut, wie wenn der Rand eines Glases zum Tönen gebracht wird; aber es war etwas Unwirkliches daran, das hast du noch nie gehört, sagte ich mir. Und dieser Laut war auf mich gerichtet.“ (Musil 1928, S. 555-556)

Und weiter

„Inzwischen war der Laut von oben körperlicher geworden, er schwoll an und drohte. […] Das erste, was ich wieder wahrnahm, war, daß mich alle ansahen. Ich stand am gleichen Fleck, mein Leib aber war wild zur Seite gerissen worden und hatte eine tiefe, halbkreisförmige Verbeugung ausgeführt.“ (Musil 1928, S. 556-557)

Kaum zu begreifen: Glück und Dankbarkeit sind die Folge dieses beinahe tödlichen Moments, oder in Azweis Worten: „Jedesmal, wenn ich mich daran erinnere, möchte ich etwas von dieser Art noch einmal deutlicher erleben!“ (Musil 1928, S. 557)

Dies dritte Erlebnis nun hat Azwei viele Jahre später. Seine Mutter, mit der er kaum mehr Kontakt gehabt hatte, ist gestorben, und Azwei kommt gerade noch zu recht, um sie zu beerdigen und auch seinen Vater noch beim Sterben zu begleiten. Und dann ist Azwei, ein bis dahin in jeder Hinsicht unternehmender Mann ohne jede Rückbesinnung, allein, zurückgekehrt in sein Kinderzimmer, in dem er seine eigenen Kinderbücher liest, und in einen seltsam versponnenen Zustand gerät. Und in diesem Zustand hat er sein drittes Erlebnis:

„Ich hatte mir auch ein Bett in dieses Zimmer gestellt und schlief dort. Und da kam dann die Amsel wieder. […] Es war vier Uhr morgens, der Tag kehrte in meine Augen ein, der Schlaf versank so rasch, wie die Spur einer Welle in trockenem Ufersand aufgesaugt wird, und da saß vor dem Licht, das wie ein zartes weißes Wolltuch war, ein schwarzer Vogel im offenen Fenster! Er saß dort, so wahr ich hier sitze.
Ich bin deine Amsel, - sagte er – kennst Du mich nicht? “ (Musil 1928, S. 561)

Und diese Begegnung versöhnt Azwei in gewisser Hinsicht mit sich selbst, oder, wie er es ausdrückt „ich bin nie im Leben ein so guter Mensch gewesen wie von dem Tag an, wo ich die Amsel besaß.“ (Musil 1928, S. 562)

Und schließlich endet die Erzählung mit folgendem kleinen Dialog der beiden Freunde:

„Aber du deutest doch an, - suchte Aeins sich vorsichtig zu vergewissern - daß dies alles einen Sinn gemeinsam hat?

Du lieber Himmel, - widersprach Azwei - es hat sich eben alles so ereignet; und wenn ich den Sinn wüßte, so brauchte ich dir wohl nicht erst zu erzählen. Aber es ist, wie wenn du flüstern hörst oder bloß rauschen, ohne das unterscheiden zu können!“ (Musil 1928, S. 562)

Diese letzten beiden Sätze sind in gewisser Hinsicht metapoetisch zu lesen: aus der Verwirrung seines Lebens weist Azwei die Amsel einen Ausweg: Sie macht all das Unsinnige, Unbegreifliche erzählbar. Sie macht es ihm möglich, eine (wenn auch "unsinnige") Einheit der Dinge zu denken. Dieser Sinn, den die Dinge nicht von sich aus haben, wird durch Erzählen hergestellt. Das Rauschen wird in Flüstern verwandelt - kein lautes, selbstbewusstes Über-die-Welt-Reden, eher ein Tasten, der Versuch, sich vor den heran drängenden Dingen zu retten, schwach, aber hilfreich.

Die Amsel ist dabei kein zufällig gegriffener roter Faden, der durch eine andere Richtschnur des Erzählens ersetzbar gewesen wäre. Bei der Bewegung aus dem Indistinkten in das Begrenzte, wohltuend Zergliederte weist nicht umsonst sie den Weg: ein sprechender Vogel. Das weiß auch Azwei gegen Ende der Erzählung, wenn er sagt: "... ich fühlte mich überaus glücklich, wenn der Vogel zu mir sprach."

Ein Dreischritt also: eine Vogelstimme zu ersten, ein singender, unheimliche Gestalt annehmender Ton zum zweiten, ein sprechender Vogel zum dritten. In dieser Weise lässt sich „Die Amsel“ als eine Bewegung vom Signal über die diskrete Information hin zum Verstehen lesen: aus dem amorphen Laut hin zu dem für Musil so zentralen 'anderen Zustand' „tagheller Mystik“, zum Glück des Verstehens.

3. Können Maschinen verstehen?

Von solchem Glück ist die Informationswissenschaft – zumindest soweit sie ihre Fundierung in der Informatik hat – weit entfernt. Hat doch die Informatik ihrerseits mit dem 'Verstehen' traditionell ihre Probleme und ist bis heute nicht einmal in der Lage gewesen, die vergleichsweise niedrige Hürde maschineller Intelligenz im Sinne einer Simulation von Denken überquerbar zu machen, die in dem so genannten Turing-Test definiert ist. Der amüsante Aufsatz von Hutchens (1996) mit dem Titel „How to pass the Turing Test by Cheating“ etwa belegt beispielreich, warum der für die Präsentation einer ersten im Sinne des Turing-Tests „intelligenten“ dialogfähigen Maschine ausgelobte und mit 100.000 Dollar dotierte Loebner-Preis so bald wohl nicht vergeben wird. Und Majumdar, Sowa und Stewart (2008) weisen in ihrer fundierten Kritik bisheriger Versuche des maschinenbasierten Sprachverstehens überzeugend darauf hin, wie weit Computerprogramme noch davon entfernt sind, 'Sprachspiele' im Sinne Wittgensteins zu beherrschen.

Es kommt hinzu, dass die Zunft der Informatiker schon mindestens zwei Traumata hinter sich hat, die beide in enger Verbindung mit dem Phänomen des Verstehens stehen und – dies meine zweite These – mit dem so genannten „Semantic Web“ ist die Informatik im Begriff, eine dritte Chance für eine endlich erfolgreiche Romanze oder wenigstens einen halbwegs substantiellen Flirt mit dem Verstehen zu vergeben.

3.1. Informatik und Verstehen I: Eliza & co.

Dabei steht im Zentrum des ersten dieser beiden Traumata – in gewisser Hinsicht ein niemals als solches anerkanntes Urtrauma der Zunft – der deutsch-amerikanische Informatiker Joseph Weizenbaum. Weizenbaum begann seine Laufbahn in den 60er Jahren als Erschaffer des Computerprogramms ELIZA, das durch die Erkennung einfacher semantischer Muster in Texten und daraus abgeleitete mittelmäßig trickreiche Fragetaktiken die Illusion einer dialogfähigen und mit Verstand begabten Instanz erwecken konnte. In einer DOCTOR benannten Variante simulierte ELIZA gar so erfolgreich den Part eines Gesprächsanalytikers, dass Psychologen auf den Gedanken verfielen, einen Teil von psychologischer Beratung auf diese Weise automatisieren zu können. Auch begannen Menschen, diesem digitalen „doctor“ mit einem dermaßen naiven Glauben an dessen Verstehenskapazität die intimsten Details ihres Lebens anzuvertrauen, dass Weizenbaum sehr schnell seiner technokratischen Unschuld verlustig ging!

So hatte Weizenbaum in einer ersten Publikation 1966 noch ELIZA und DOCTOR mit einer gewissen Portion Machbarkeitsoptimismus vorgestellt, um dann aber in einer zweiten Publikation im Jahr 1967 schon sehr viel nachdenklichere Töne anzuschlagen:

„There can be no total understanding and no absolutely reliable test of understanding. To know with certainty that a person understood what has been said to him is to perceive his entire belief structure and that is equivalent to sharing his entire life experience. It is precisely barriers of this kind that artists, especially poets, struggle against. This issue must be confronted if there is to be any agreement as to what machine "understanding" might mean.“ (Weizenbaum 1967, S. 476)

Diese Nachdenklichkeit wandelte sich bei Weizenbaum über die Jahre zu einem regelrechten Entsetzen angesichts der mehrheitlichen Weigerung seiner Kollegen, die von ihm aufgeworfenen Fragen – und darunter an erster Stelle die nach der Natur des 'Verstehens' - überhaupt nur zur Kenntnis zu nehmen. Weizenbaum verstand sich in der Folge als ein „Dissident“ der Informatik und ist mit Publikationen wie „Die Macht der Computer und die Ohnmacht der Vernunft“ (1976) bis zu seinem Tod das verkörperte Gewissen einer wissenschaftlichen Disziplin geblieben, die ihrerseits das hier angesprochene erste Trauma zumindest lange Zeit ganz überwiegend verdrängt hat.

3.2. Informatik und Verstehen II: Aufstieg und Fall der Expertensysteme

Ohne diese Verdrängungsleistung wäre wohl eine zweite Phase aggressiver Naivität beim Umgang der Informatik mit Begriffen wie „Denken“ und „Verstehen“ in den achziger Jahren des letzten Jahrhunderts nicht denkbar gewesen.

Diese hatte ihre Wurzeln in der Frühzeit der Forschung zur Künstlichen Intelligenz – kurz: KI -, die in den fünfziger Jahren in ihrer Spielart als 'starke' KI mutige Postulate aufstellte wie das Folgende:

"Every aspect of learning or any other feature of intelligence can be so precisely described that a machine can be made to simulate it." (McCarthy 1955)

Eine der Leitvorstellungen der 'starken' KI war, dass das menschliche Gehirn simulierbar sei. Vertreter dieser Gruppe wie Hans Moravec oder Ray Kurzweil behaupteten, es sei technisch machbar, das Gehirn 1:1 in Hard- und Software zu modellieren, und eine solche Simulation werde im wesentlichen mit dem Original identisch sein. Sie kombinierten damit die Vorstellung, dass eine hinreichend mächtige Maschine jeden beliebigen Prozess simulieren könne mit der positivistisch-materialistischen Annahme, das Denken sei das alleinige Resultat physischer Hirnprozesse.

Die 'starke' KI erlebte eine frühe Goldgräberphase und in den siebziger Jahren anschließend einen ausgeprägten Katzenjammer insbesondere nach dem Zusamenbruch der US-amerikanischen Förderung aufgrund desaströser Forschungsergebnisse bei der maschinellen Übersetzung und nach dem völligen Zurückfahren der großbritannischen Förderung nach Erscheinen des sog. 'Lighthill Report', der eine weitgehende Ineffizienz der KI-Forschung festgestellt hatte.

Dennoch etablierte sich in den späten siebziger und in den frühen achtziger Jahren eine als 'schwache' KI etikettierte Forschungsrichtung, als deren Resultat so genannte „Expertensysteme“ populär wurden. Diese wurden mit dem Anspruch vermarktet, das Wissen von Experten in klar umrissenen Kenntnisdomänen ersetzen zu können und darüber hinaus 'selbstlernend' zu sein, in gewissen Grenzen also die eigene Wissensbasis selbständig erweitern zu können. Diese Expertensysteme wuchsen sich zu einem eigenen Industriezweig aus und waren Mitte der achziger Jahre ein veritabler wirtschaftlicher Erfolg: es entstand eine milliardenschwere Industrie um die Programmiersprache LISP, in der die meisten dieser Expertensysteme realisiert waren, bis hin zu speziell auf die LISP-Verarbeitung hin optimierter Hardware, den sog. LISP-Machines.

Grundsätzlich sollten die Expertensysteme in der Lage sein, zumindest in einer klar abgegrenzten Domäne Information zu verstehen und in gewissen Grenzen auch die eigene Verstehensbasis selbst zu erweitern. Doch bald stellte sich heraus, dass es mit den Lernfähigkeiten nicht weit her war, dass Expertensysteme bei unerwartetem Input teilweise groteske Fehler produzierten, und dass sie außerdem in der Systempflege enormen Aufwand nach sich zogen. Nachdem dann auch noch eine neue Generation von generischen Personal Computern zu weitaus geringeren Kosten die hochgezüchteten und teuren LISP-Maschinen zu überflügeln begannen, brach dieser Milliardenmarkt fast über Nacht in sich zusammen. Es begann in der Folge, was oft in Analogie zum nach einer Kernexplosion prognostizierten radioaktiven Winter als der 'KI-Winter' bezeichnet wurde: für mehr als zehn Jahre war die KI danach zumindest förderpolitisch mausetot!

In gewisser Hinsicht hatte die Art und Weise, wie sich manche Vertreter der starken wie auch der schwachen KI in der Öffentlichkeit gerierten und wie sie ob ihrer letztlich nicht einlösbaren Versprechungen von weiten Teilen der Politik hofiert wurden, gewisse Ähnlichkeiten mit Verhalten und Stellung mancher mittelalterlicher Alchemisten an den damaligen Adelshöfen. Man verstand auch diese nicht wirklich, aber die unglaubliche Attraktivität ihrer Versprechungen – damals Gold, heute die Reproduzierbarkeit menschlicher Intelligenz (mit der impliziten Folge übrigens ihrer letztlichen Substituierbarkeit!) - machte blind für die Lücken, Defizite und Ungereimtheiten ihres Diskurses. Und wie schon der Bankrott der Alchemisten dazu führte, das auch ihre begründeteren Träume und Visionen gründlich entwertet und verbrannt waren, so führte auch die Einsicht in die Nicht-Einlösbarkeit so mancher Versprechungen der KI eben in der Folge auch dazu, dass das Nachdenken über das 'Verstehen' in der Informatik wieder weitgehend zum Erliegen kam: ein Stück weit war das Thema zumindest in weiten Teilen der des Faches damit verbrannt und ungeliebt.

Eine weitere Chance für die Informatik, sich dem Begriff des Verstehens grundlegender zu nähern, war damit vertan.

3.3. Informatik und Verstehen III: Semantic Web oder Syntactic Web?

Doch mit der momentanen Konjunktur des Attributs „semantisch“ in weiten Teilen der Informationstechnik und dabei insbesondere im Kontext des rapide Gestalt annehmenden 'Semantic Web' stellt sich die Frage nach dem maschinellen Verstehen erneut und diesmal sehr praktisch: es ist nun zu fragen, inwieweit das Attribut 'semantisch' im Verwendungskontext des 'Semantic Web' denn nun ernsthaft mit 'Bedeutung' und 'Verstehen' in Verbindung zu bringen ist, wie es ein naiver Betrachter wohl reflexhaft zu tun versucht sein dürfte.

Und in der Tat ist auch hier eine gewisse Skepsis angebracht. Ist doch das Semantic Web in seiner gegenwärtigen Ausprägung vor allem der Versuch, Informationsinstanzen im Netz und diese zum World Wide Web verbindende Graphen in einer Weise modellierbar zu machen und mit formalisiert-differenzierten Attributen zu versehen, die letztlich diese Informationsinstanzen durch Maschinen nach Regeln prozessierbar machen. Und diese Regeln müssen in logikbasierten Sprachen formulierbar sein, um für Maschinen ausführbar zu sein.

Der Erfinder des Semantic Web, Tim Berners-Lee, fasst dies folgendermaßen:

„The computer doesn’t truly „understand“ any of this information, but it can manipulate the terms much more effectively in ways that are useful and meaningful to the human user“ (Berners-Lee 2001).

Und in diesem Sinne konstatiert Veltman (2004) bezogen auf die gegenwärtige Situation zu Recht:

„Aspirations for a semantic web in a deeper sense have failed because of the limitations of logic and machines. We would need to conclude that a semantic web which deals only tangentially with meaning might more accurately be called the transactions web [...] or the logic web.“

Und doch zielt Veltmans Kritik in gewisser Hinsicht ins Leere, denn genau diesen Ehrgeiz ein semantisches Netz im eigentlichen Wortsinn zu schaffen hatte das von Berners-Lee propagierte Vorhaben des 'Semantic Web' nie: es handelt sich auch von seiner Programmatik her eben wirklich nur um einen transaktions- oder logikzentriertes Ansatz, für den wahrscheinlich die Bezeichnung „Syntactic Web“ angemessener gewesen wäre. Allerdings dürfte dieser terminologische Sündenfall wohl kaum mehr zu heilen sein: angesichts der stetig wachsenden medialen Präsenz des 'Semantic Web' bzw. seiner Populärvariante Web 3.0 ist der Weg zu einem Modell, das dem impliziten Anspruch dieses Begriffes eher angemessenen ist, momentan kaum gangbar, jedenfalls nicht unter dem rubrum „Semantic Web“.

Dies also sind zusammengefasst die drei gescheiterten Flirts der Informationstechnologie mit dem 'Verstehen': die platte Simulation des Verstehens in ELIZA und seiner Abkömmlinge bis zu den heutigen Chatbots, die totale Mechanisierung des Verstehens in den Allmachtsphantasien der KI und die Annexion des Attributs 'semantisch' durch die 'Community' des Semantic Web.

4. Plädoyer für ein hermeneutisches Web

Und dennoch wäre es grundfalsch, das Projekt ernsthaft verstehensähnlicher Operationen in netzbasierten digitalen Umgebungen nun einfach aufzugeben. Dies allein schon, weil wir - wie ich eingangs darzulegen versucht habe – in Zukunft Techniken benötigen werden, die uns in die Lage versetzen, große Mengen digitaler Informationsobjekte zu verstehen ohne diese im traditionellen Sinne lesen zu können. Aber auch – und vor allem! - weil auf diese Weise ganz neuartige und möglicherweise erstaunlich fruchtbare methodische Ansätze vor allem in den hermeneutisch basierten Wissenschaftsdisziplinen entstehen könnten, über die ich an anderer Stelle publiziert habe (Gradmann 2007, Gradmann/Meister 2008).

Und damit zurück zu Veltman: seine Fundamentalkritik des 'Semantic Web' richtet sich zwar zwar gegen einen Anspruch, den dessen Initiatoren zumindest nie explizit erhoben haben – zugleich benennt aber seine Kritik des dem Semantic Web zugrunde liegenden Bedeutungsmodells einige der elementaren Bedingungen, die als Voraussetzungen für verstehensähnliche Szenarien im WWW zu schaffen wären.

Erforderlich ist dabei allererst eine Überwindung des in der WWW-community weit verbreiteten eindimensionalen ontologischen Weltmodells, dass in bester aristotelischer Tradition allein dem Substanzaspekt verpflichtet ist und keine gleitenden Übergänge zwischen Substanz und Funktion kennt, so dass es in der Folge auch völlig statisch bleibt und keine Evolution von Bedeutung erlaubt.

Zugleich ignoriert der Ontologiebegriff des Semantic Web alle Unterscheidungen hinsichtlich der Seinsweise von Wissen - ostensiv, nominal oder real – wie sie in der Lehre von der Wissensorganisation im vergangenen Jahrhundert herausgearbeitet worden sind.
Auch blendet diese Sichtweise konsequent die Möglichkeit unterschiedlicher Ebenen von Sprachgebrauch aus und ignoriert dabei insbesondere die Unterscheidung zwischen Terminologie und Alltagssprache.

Schließlich reduziert der Ansatz des Semantic Web alle denkbaren Relationen auf formal-logische Beziehungen. Diese aber – wie der von den Apologeten dieses Bedeutungsmodells gern zitierte John Sowa selbst zugesteht – stellen für die Modellierung sprachlicher Tatbestände und deren Interpretation wahrscheinlich nicht das am besten geeignete Instrument dar.

Unter all diesen von Veltman benannten Mängeln schlummert aber wohl letztlich ein Elementardefizit hinsichtlich der zeichentheoretischen Grundlagen ihrer Bedeutungsmodelle, welches große Bereiche der Informatik betrifft. Ohne eine differenzierte semiologische Fundierung muss jeder Versuch, 'Bedeutung' und 'Verstehen' jenseits primitiver denotativer Bedeutungsbeziehungen zu modellieren Stückwerk bleiben – zumal, wenn er denn die erforderlichen diachronen Bezüge einschließen soll!

Dies also ist meine dritte These:

Erforderlich ist die Beseitigung der oben angesprochenen Defizite des Semantic Web auf Grundlage einer adäquaten semiologischen Theorie digitaler, netzbasierter Bezeichnungs- und Bedeutungsmodi.

Auf diese Weise wäre die Ausgangsbasis hergestellt für die von Benel (2001) geforderte hermeneutisch basierte Fassung des Ontologiebegriffs im Semantic Web. Diese wiederum wäre das Fundament eines multilingualen und multikulturellen WWW, in dem wir dem maschinell basierten Verstehen in einem für weite Teile der Geisteswissenschaften konstitutiven Sinne erheblich näher kommen könnten.

Eine solche hermeneutische Fundierung würde die von Capurro (2006) angesprochene „Gegenbewegung vom Abstrakten hin zum Guten als dem Menschenmöglichen“ vollziehen. Sie stellt damit – wieder mit den Worten Capurros - „eine ethische Herausforderung bei der Schaffung des „semantic web“ dar.“ (Capurro 2006)

In einem solchen wahrhaft semantischen Netz könnten die folgenden Sätze Weizsäckers als Richtschnur dienen:

„Daß es Sprache als Information gibt, darf niemand vergessen, der u¨ber Sprache redet. Daß Sprache als Information uns nur möglich ist auf dem Hintergrund einer Sprache, die nicht in eindeutige Information verwandelt ist, darf niemand vergessen, der über Information redet.“ (Weizsäcker 1974, S. 60)

Und ein solcher Ansatz würde die Wissensarchitektur des WWW dann auch letztlich auf dem Vektor positionierbar machen, der durch den Dreischritt Signal – Information – Zeichen markiert ist.

Vom Glück des Verstehens, wie in Musils Amsel evoziert, wären wir damit immer noch ein gutes Stück weit entfernt – aber zumindest näher gekommen wären wir ihm, vielleicht so nahe es unter den Bedingungen digital basierter Wissenschaft eben vorstellbar ist.

Ein solches Großprojekt – dies sollte zugleich deutlich sein – kann nicht allein Sache der Informatik sein, so wenig es andererseits als rein geisteswissenschaftlich fundiertes Unterfangen ohne Beteiligung der Informatik gelingen kann. In einer solchen Konstellation, so meine letzte These, kann die Informationswissenschaft eine wichtige und möglicherweise sogar entscheidende Rolle als Mittler und/oder Integrator spielen.

Ich bin daher sehr froh, dass unser Institut eine wichtige Rolle inne hat bei Konzeption und Aufbau der Semantikschicht in der nun entstehenden Europäischen Digitalen Bibliothek, der Europeana! Dort realisieren wir eine digitale Bibliothek neuen Typus, in der digitalisierte und genuin digitale Kultur- und Informationsobjekte primär über semantisch basierte Zugriffswege zugänglich werden. Ich begreife unsere Rolle in diesem Großprojekt nicht zuletzt als Chance der wissenschaftlichen und institutionellen Positionierung für unser Institut und unsere Universität.

Ganz zum Schluss noch einmal zurück zu Josef Weizenbaum, der in diesem Jahr hier in Berlin gestorben ist, und dem ich diese Vorlesung widmen möchte. In einer seiner allerletzten Publikationen vor seinem Tod schrieb er:

„Würde die weltweite Gesellschaft nur vernünftig sein, könnte das bis heute erreichte Wissen der Menschheit aus dieser Erde ein Paradies machen. In der Tat ist sie kein Paradies, sondern ein Irrenhaus - doch nicht, weil wir etwa nicht genug wissen.“ (Weizenbaum 2008)

– und ich möchte diesen Gedanken zu Ende führen mit den Worten: sondern weil wir nicht genug verstehen!

Ich danke für Ihre Geduld und Aufmerksamkeit.

Literatur

Benel, Aurélien et al. (2001). Truth in the digital library: from ontological to hermeneutical systems. In: Proceedings of the fifth European conference on research and advanced technology for digital libraries (Lecture notes in computer science), vol 2163. Heidelberg, S. 366-377.

Berners-Lee, Tim; Hendler, James; & Lassila, Ora (2001). The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 284(5), S. 34-43.

Capurro, Rafael (2006). Hermeneutik revisited. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.): Semantic Web. Wege zur vernetzten Wissensgesellschaft. Berlin: Springer. S. 527-533.

Crane, Gregory (2006). What Do you Do with a Million Books? In: D-Lib Magazine, Vol. 12, March. URL: http://www.dlib.org/dlib/march06/crane/03crane.html

Franz, Michael et. al. (Hrsg) (2007). Electric Laokoon. Zeichen und Medien, von der Lochkarte zur Grammatologie. Berlin: Akademie.

Gradmann, Stefan (2008). Some thoughts on the importance of open source and open access for emerging digital scholarship. In: Proceedings of the Wittgenstein Symposium Kirchberg, 05.08.-11.08.2007. S. 275-286.

Gradmann, Stefan; Meister, Jan-Christoph (2008). Digital document and interpretation: re-thinking ‘‘text’’ and scholarship in electronic settings. In: Poiesis & Praxis 2008 (5), S. 139-153. URL: http://www.springerlink.com/content/g370807768tx2027/fulltext.pdf

Majumdar, Arun; Sowa, John; Stewart, John (2008). Pursuing the Goal of Language Understanding. In: Eklung, Peter; Haemmerlé, Ollivier (Hrsg.): Conceptual Structures: Knowledge Visualisation and Reasoning (ICCS 2008/LNAI 5113). S. 21-42.

McCarthy, John; Minsky, Marvin; Rochester, Nathan; Shannon, Claude (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. URL: http://www-formal.stanford.edu/jmc/history/dartmouth/dartmouth.html

Musil, Robert (1928): Die Amsel. In: ders.: Gesammelte Werke, Bd. 7. Kleine Prosa, Aphorismen, Autobiographisches.

Veltman, Kim (2004). Towards a Semantic Web for Culture. Journal of Digital Information , Vol. 4, No. 4. URL: http://jodi.tamu.edu/Articles/v04/i04/Veltman/.

Weizenbaum, Joseph (1976). Die Macht der Computer und die Ohnmacht der Vernunft. Frankfurt: Suhrkamp.

Weizenbaum, Joseph (2008). Grenzen des Wissens. Wir gegen die Gier. In: Süddeutsche Zeitung 08.01.2008

Weizsäcker, Carl Friedrich (1974): Die Einheit der Natur. München: dtv.

Fußnoten

[Fn 1] Ähnlich Franz (2007), S. 28 ff. (zurück

Signal. Information. Zeichen. Zu den Bedingungen des Verstehens in semantischen Netzen.