Stammtisch: Nachlese vom 30. Dezember 2004
Für die Bildersucher gibt es zunächst mal schlechte Nachrichten.
Am Stammtisch war der 21C3 das Hauptthema. Es wurde über diverse Vorträge u.a. diskutiert. Weitere Themen waren:
- Kopfzeilen in LaTeX
- Konrad wollte wissen, ob und wie man in LaTeX die Kopfzeilen in variabler Höhe setzen kann. Wie Thomas und ich schon feststellten, ist KOMA-Script hierzu whs. die Klasse der Wahl. Auf Seite 29/30 der Anleitung (scrguide) wird hierzu auch etwas geschrieben. Weiterhin hat Markus Kohm im Thread "Mehrzeilige Kopfzeilen bei scrartcl" in de.comp.text.tex einige Worte dazu verloren.
- Anonymes surfen
- Im Laufe des Abends war auch Anonymität im Netz und speziell anonymes Surfen ein Thema. Zum einen existiert hier der JAP, ein Anon-Proxy der TU Dresden. Dieser hatte jedoch in der Vergangenheit einige Probleme und jeder Nutzer sollte für sich selbst entscheiden, ob der Knoten Dresden für ihn noch vertrauenswürdig ist. Einen anderen Weg geht Tor. Tor ist ein dezentrales Onionrouting-Netzwerk und versucht, starke Anonymität für den Nutzer zu schaffen. Auf dem 21C3 sprach auch einer der Entwickler zu dem Thema.
- Code wiederverwerten
- In aller Regel wird dergleiche Code mehrmals von verschiedenen Leuten entwickelt. Die Webseite Koders.com ist angetreten, um eine Art Sammelstelle für derartigen Code zu bieten. Die Nutzer können nach verschiedenen Kriterien suchen und evtl. passenden Codestücke finden.
- Fnord
- Es tauchte die Frage auf, was Fnord sei. http://koeln.ccc.de/archiv/drt/fnord.html bietet hinreichende Informationen.
- MD5 considered harmful
- Dan Kaminsky hat auf dem 21C3 einen äußerst interessanten Vortrag zu den bisher bekannten Schwächen von MD5 gehalten. Seine Erkenntnisse hat er in einem Schriftstück zusammengefasst.
- Wie sucht und findet man?
- Fravia hat wieder mal einen hervorragenden Workshop zum Thema Suchen und Finden im Netz gemacht. Die Unterlagen dazu finden sich auf http://www.searchlores.org/berlin2004.htm.
- Worthäufigkeiten
Konrad will von einem Programm erkennen lassen, in welcher Sprache ein Text (wahrscheinlich) geschrieben ist. Dabei will er die zehn oder zwanzig häufigsten Wörter suchen. Ebenso mit Buchstaben und Buchstabenfolgen. Daran soll sich eine Sprache sehr gut erkennen lassen.
In der gawk-Manpage ist ein Beispiel, mit dem man zählen kann, wieviele unterschiedliche Worte in einem Text vorkommen. Dieses haben wir modifiziert, dass für ein Wort die Häufigkeit gezählt wird.
BEGIN { RS = "[^A-Za-z]+" } { x=tolower($0); if (length(x) > 2) { if (! x in word) { word[ x ] = 1; } else { ++word[ x ]; } } } END { for ( i in word ) print word[i] "\t" i; }Lutz meinte hierzu in der Diskussion in der Newsgroup, dass Koinzidenzindex das richtige Stichwort ist. Sein Beispielprogramm:
module Main where import Data.List(sortBy) import Data.Char(toLower) histogram :: (Eq a) => [a] -> [(a,Int)] histogram xs@(x:_) = (x, length (filter (x==) xs)) : histogram (filter (x/=) xs) histogram [] = [] sortHist :: (Ord b) => [(a,b)] -> [(a,b)] sortHist = sortBy compareHist where (_,a) `compareHist` (_,b) = b `compare` a main = interact (unlines . map show . take 10 . sortHist . histogram . words . map toLower)