ERLEDIGT
NEIN
NEIN
ANTWORTEN
3
3
ZUGRIFFE
481
481
EMPFEHLEN
-
22.11.10 17:03 #1
Hallo Leute,
ich bin derzeit auf der Suche nach einer Software oder einem Verfahren, um Ähnlichkeiten zwichen zwei (Quell-)Texten feststellen und bewerten zu können. Leider funktionieren die einfachen Methoden, wie z.B. die Levenshtein-Distanz da nicht.
Hat da jemand mal ein Stichwort für mich, wo ich ansetzen könnte?
-
Was genau hast du denn vor? Möchtest du es für dich nutzen, um etwas zu vergleichen oder soll irgendein System damit automatisiert arbeiten?
Da ich nicht genau weiß, was du vor hast, hier mal zwei Sachen die mir einfallen. Jeweils mit Beispiel Ausgabe mit zwei Testdateien.
http://meld.sourceforge.net/
Ausgabe: s. Anhang
http://manpages.ubuntu.com/manpages/...n1/diff.1.html
Ausgabe
1c1
< <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
---
> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
14a15,16
> alert(1);
> alert(1);
15a18,20
> alert(1);
> alert(1);
> alert(1);
22c27
< <div></div>
---
> <div>HUHU</div>
24c29
<
---
> fail
-
Hallo,
bei Quelltexten könntest du es mal mit einem diff-Ansatz versuchen. Ob das sinnvoll ist, kommt aber ganz darauf an, welches Ähnlichkeitsmaß dir vorschwebt.
Grüße,
Matthias„Gib einem Menschen einen Fisch, und er wird für einen Tag satt. Lehre ihn Fischen, und er wird ein Leben lang satt.“
“For every complex problem, there is an answer that is short, simple and wrong.”
“Pessimism is safe, but optimism is a lot faster!”
Aktuelles Coding Quiz: #17 - Wörter kreuz und quer
-
22.11.10 17:26 #4
Ich suche momentan eher nach einem Algorithmus, als nach einer fertigen Softwarelösung. Das Problem von diff ist leider, dass dieses Programm recht dumm ist. Wenn ich jetzt große Änderungen an den Variablen durchführe, wird es keine Ähnlichkeit anzeigen und auch das Umstellen von unabhängigen Blöcken würde diff nicht auffinden können.
Ich weiß nicht so ganz, wie ich es sagen soll, aber ihr kennt das doch auch. Ihr seht einen Quelltext, den ihr selbst geschrieben habt, allerdings wurde er ziemlich vergewaltigt. Die Formatierung ist nicht in Ordnung, Kommentare sind anders, Variablen wurden umbenannt, Zahlen wurden an eine andere Umgebung angepasst, etc. Aber die eigentliche Funktion des Quelltextes ist immer noch die gleiche.
Ähnliche Themen
-
Trennlinie zwischen zwei Texten stets so lang wie der längere Text
Von NTDY im Forum CSSAntworten: 1Letzter Beitrag: 04.05.10, 11:25 -
Mit substr zwischen Satz zwischen zwei Wörtern trennen
Von juhuhuhuhu im Forum PHPAntworten: 7Letzter Beitrag: 13.04.07, 11:25 -
Modellierung von zwei Beziehungen zwischen zwei Klassen in Hibernate
Von janw im Forum JavaAntworten: 1Letzter Beitrag: 26.05.06, 13:24 -
Zwischen zwei Werten
Von formmad im Forum Flash PlattformAntworten: 2Letzter Beitrag: 17.02.06, 10:38 -
entfernung zwischen zwei punkten
Von Tobias K. im Forum Cinema 4DAntworten: 3Letzter Beitrag: 16.03.03, 20:55





Zitieren
Login





