Algorithmen ermöglichen Rekonstruktion verlorener Texte

23. August 2009, 16:47

Israelische Forscher vor allem mit hebräischen und arabischen Palimpsesten beschäftigt

Beer-Sheva - Forscher an der israelischen Ben-Gurion University (BGU) of the Negev haben Algorithmen entwickelt, um ein Studium schlecht erhaltener bzw. sogar überschriebener historischer Texte zu erleichtern. Im Rahmen eines Projekts, an dem Informatiker und Humanisten zusammenarbeiten, wollen die Wissenschaftler computergestützt auch den Originaltext sogenannter Palimpseste rekonstruieren. "Ein Palimpsest ist ein Pergament, von dem der ursprüngliche Text abgeschabt und mit neuem Text überschrieben wurde", erklärt die projektbeteiligte Informatikerin Klara Kedem. Der Schwerpunkt des Projekts, das in Zusammenarbeit mit Humanisten der Universität betrieben wird, liegt in der Erfassung hebräischer und arabischer Texte. Gerade der Ansatz zur Rekonstruktion von Palimpsesten könnte aber auf jegliche Schriftzeichen angewandt werden.

Das Projektziel auf technischer Ebene ist, mithilfe von hochentwickelten Algorithmen zur Textrekonstruktion und -analyse ein Open-Source-System zu schaffen, das dann genutzt werden kann, um die Forschung an historischen Dokumenten voranzutreiben. Ein Problem, das es dabei zu lösen gilt, ist die Rekonstruktion des Originaltexts bei Palimpsesten. "Dazu verwenden wir zunächst die Bildverarbeitungsmethode des Thresholding, um den neuen Text zu identifizieren", erklärt Kedem. Denn dieser ist in der Regel deutlich dunkler als Spuren des Originaltexts oder unbeschriebenes Pergament. Der einst abgekratzte Text wiederum hebt sich vom leeren Blatt ebenfalls ab - wenn auch leichter. Das erlaubt es, mittels Algorithmen die Position alter Schriftzeichen zu bestimmen. "Dann wenden wir Inpainting-Techniken an, um die markierten Bereiche zu vervollständigen und das restaurierte Bild zu gewinnen", so die Informatikerin. Vergleichbare Techniken kommen beispielsweise zur Bildrekonstruktion bei alten Fotos und Filmen zum Einsatz, wenn Teilbereiche schlecht erhalten sind.

"Diese Methode würde für jegliche Art von Palimpsest funktionieren, unabhängig davon, welche Schriftzeichen genutzt wurden", meint Kedem. Das BGU-Projekt umfasst aber noch weitere Algorithmen, die speziell auf hebräische und arabische Texte ausgelegt sind. Dazu zählt etwa die computerisierte Unterstützung der paläografischen Analyse. Diese befasst sich etwa mit Buchstabenformen und gebräuchlichen Abkürzungen und kann unter anderem die Datierung von Dokumenten ermöglichen. Außerdem sind viele Rekonstruktionstechniken auch für Texte interessant, die nicht überschrieben wurden, sondern einfach nur schlecht erhalten sind. Wie gut sich die Computeralgorithmen für die Untersuchung alter Schriften bewähren, wird im Rahmen des Projekts von Humanisten wie Uri Ehrlich, Professor am Goldstein-Goren Department of Jewish Thought der BGU, anhand realer Texte untersucht. Dazu zählen unter anderem Fundstücke aus der Kairoer Geniza. In diesem Ende des 19. Jahrhunderts entdeckten Raum der Ben Esra Synagoge wurden an die 200.000 Manuskripte gefunden, die teilweise bis ins 9. Jahrhundert zurückgehen. (pte/red)

Prolet
10
24.8.2009, 12:08
Das Quirks mit den Algorithmen und dem Patentrecht!

Wieviel vom Wirtschaftsnutzen der EU durch die komische Haltung einen Wasserfliegenfänger zu patentieren, aber Algorithmen die Millionen das Leben retten können sollen frei kopierbar sein?

Große helfen sich mit der Technizität des Hinwendens zum Patentamt und seinem Personal.

Dabei meinen Experten, es wird in Bälde alles durch software gesteuert und das Erfinden von Algos soll, auch bei höchster Neuheit, frei kopierbar sein?

Wer entwickelt da noch, oder wer sucht seine Partner nicht in USA - und die EUropäer zahlen Lizenzen.

Nick Tameer
00
25.8.2009, 10:09

Abgesehen davon, dass es auch ein Urheberrecht gibt, wäre natürlich der Umstand, dass das Leben von Millionen daranhängt, ein recht gutes Argument für freie Kopierbarkeit, jedenfalls in einer vernünftigen Welt.

Der Ätzer
00
25.8.2009, 13:05
Das gute Argument für Kopierbarkeit verhindert Invest in Ideen!

Nach Jahren Arbeit als nützlicher Idiot dazustehen, andere krallen sich die Software und machen das Geschäft?

Urheberrecht ist für Programmcode untauglich, da kleinere Veränderungen die Schutzrechte aushebeln.

Wenn der Unterhaltungswert so geschützt ist, ok. Siemens macht schon 60% Umsatz im Medizinbereich mit Software.

Da Software in Japan, USA und anderen Staaten schützbar ist, wird Europa kostenlos Kopieren aber umsonst und gratis den Kürzeren ziehen.

Eine Software die Daten als Funktion der Zeit verlustfrei beliebig klein rechnet, kann so lange nicht eingeführt werden, bis die Schutzrechte klar sind.

Soll 5.- € mtl. kosten, verbilligt Mobilphone und ermöglicht HDTV über Inet. Vom alem Anderen ganz abgesehen.

So schaut's aus!

friedrich wilhelm voigt
00
28.9.2009, 02:58

"Eine Software die Daten als Funktion der Zeit verlustfrei beliebig klein rechnet"

na auf die software bin ich aber gespannt...

Nick Tameer
00
25.8.2009, 19:06

Gegenargument: Open Source.

Der Ätzer
00
26.8.2009, 07:34
Wäre das ein Argznent, gäbe es keine Softwarepatente im Ausland!

Der Schaden entsteht indem der Nutzen verhindert wird.

Ein Patent ist nie mehr wert als seine Verbesserung gebenüber dem Istzustand.

Das bewirkt auch bei Lizenzgebühr einen Vorteil für den Kunden.

Es ist wie mit den Steuern - wer wenig Steuern bezahlen will, will auch wenig verdienen.

Aus redlicher Sicht.

Nick Tameer
00
24.8.2009, 11:55

Aber die Manpower! Ich würde gleich ein neues Stück Pergament kaufen.

werwolfi
00
24.8.2009, 04:25

ach was, software - einfach den neuen text wiederum abkratzen ;o))

Die Kommentare von Usern und Userinnen geben nicht notwendigerweise die Meinung der Redaktion wieder. Die Redaktion behält sich vor, Kommentare, welche straf- oder zivilrechtliche Normen verletzen, den guten Sitten widersprechen oder sonst dem Ansehen des Mediums zuwiderlaufen (siehe ausführliche Forenregeln), zu entfernen. Der/Die Benutzer/in kann diesfalls keine Ansprüche stellen. Weiters behält sich die derStandard.at GmbH vor, Schadenersatzansprüche geltend zu machen und strafrechtlich relevante Tatbestände zur Anzeige zu bringen.