Wie kann ich den längsten Eintrag in einem Wörterbuch herausfinden?

351
Cesar

Ich fragte bei der englischen Stack Exchange vorbei: "Was ist das englische Wort mit der längsten Einzeldefinition?" Die beste Antwort, die sie geben könnten, ist, dass ich ein Programm benötigen würde, das den längsten Eintrag in einer (Text-) Datei mit den Wörterbuchdefinitionen ermitteln könnte, indem ich die Anzahl der Zeichen oder Wörter in einem bestimmten Eintrag zähle und dann eine Liste der längste Einträge.

Ich habe eine Wörterbuchdatei gefunden, die in Text umgewandelt wurde und folgendes Format hat:

a / a / unbestimmter Artikel (ein vor einem Vokal) 1 jeder, einige, einer (einen Cookie haben). 2 eine einzige Sache (es gibt kein Geschäft für Meilen). 3 pro, für jeden (zweimal täglich nehmen).

Aardvark / ard-vark / n ein afrikanisches Säugetier mit langer Schnauze, das sich von Ameisen ernährt.

Abakus / a-ba-kus, a-ba-kus / na Zählrahmen mit Perlen.

Wie Sie sehen, kommt jede Definition nach der Aussprache (eingeschlossen durch Schrägstriche) und dann entweder:

1) endet mit einem Punkt oder

2) endet vor einem Beispiel (in Klammern eingeschlossen) oder

3) folgt einer Zahl und endet mit einem Punkt oder vor einem Beispiel, wenn ein Wort mehrere Definitionen hat.

Was ich dann brauchen würde, ist eine Funktion oder ein Programm, das jede Definition unterscheiden kann (einschließlich der Berücksichtigung mehrerer Definitionen eines einzelnen Wortes als separate), und dann die Anzahl der Zeichen und / oder Wörter zählen (wobei die Beispiele in Klammern seitdem ignoriert werden) ist nicht die richtige Definition), und schließlich eine Liste der längsten Definitionen (ich glaube nicht, dass ich mehr als nur eine Top-20-Kategorie zum Vergleich benötigen würde). Wenn das Dateiformat ein Problem war, kann ich die Datei problemlos in PDF, EPUB usw. konvertieren. Und ich denke, ich würde im Idealfall wählen können, ob ich die Länge nach Zeichen oder nach Wörtern zählen würde, wenn dies möglich wäre.

Wie soll ich das machen? Danke im Voraus.

1
Sie können die Liste in Excel importieren, Duplikate entfernen, die LEN-Funktion verwenden, um die Anzahl der Zeichen zu zählen, und dann mit der LEN-Funktion nach der Spalte sortieren. BillDOe vor 6 Jahren 0
Mit einem `bash`-Skript in Linux ist das sehr einfach. AFH vor 6 Jahren 0
Ich bin unter Windows 7. Wie würde Excel mehrere Definitionen unterscheiden, wenn sie nicht durch einen Zeilenumbruch getrennt sind? Cesar vor 6 Jahren 0

0 Antworten auf die Frage