Episode 107/2017: Dokumentenmanagement

Die letzten Tage genutzt und einige Stunden mit Recherche für ein halbwegs brauchbares Dokumentenmanagementsystem zugebracht, denn:

Irgendwann ist die Strategie für Papierdokumente mit unterschiedlichen Aufbewahrungspflichten ziemlich optimiert und ausgereizt; danach wünscht man sich dann bald weitergehende Vorteile eines digitalen Systems. Vorteile, die gleichzeitig einem Teil meiner Anforderungen entsprechen:

  • Texterkennung (OCR) bei gescannten oder abfotografierten Dokumenten bzw. Fotos
  • gute Ordnungs- und Klassifizierungsmöglichkeiten (Gruppen, Kategorien, Tags, Dokumententypen, Labels)
  • gute Import- und Exportmöglichkeiten
  • Volltextsuche mit Gewichtung
  • Intelligente Gruppen basierend auf Regeln
  • Dokumente bearbeiten vereinen können (z.B. Bilder rotieren, Texterkennung, danach in durchsuchbares PDF umwandeln)
  • Synchronisierung auf alle im Einsatz befindlichen Computer

Von den verschiedenen Tools, die ich mir angesehen habe, stach für einfachere Anwendungsfälle „Paperless“ heraus, das es in der aktuellen Version für ca. 40 Euro im AppStore gibt. Es wirkt minimalistisch, aber durchdacht. Es könnte sich tatsächlich für viele einfachere Anwendungsfälle eignen, wenn einfach nur eine gewisse Grundordnung ins Chaos zu bringen das oberste Ziel ist. Was mich beeindruckt hat war die Report-Funktion, die überraschend die Gesamtsumme der Bruttowerte von einem Haufen Rechnungen aus dem Jahr 2016 fehlerfrei berechnet hat. Auch für Adhoc-Notizen bietet es entsprechende Funktionen an.

Aktuell tendiere ich aber zu einer Lösung von DEVONthink. Die oben genannten Anforderungen deckt es alle ab. Die Software wirbt auch mit eingebauter künstlicher Intelligenz, vermutlich ein aufgebohrter Klassifizierungs-Algorithmus (Hust, Update 23:09 Uhr: Little did I know), der z.B. zur Autoklassifizierung bei einem (Massen-)Dokumentenimport benutzt werden kann; oder zum Entdecken von Querverbindungen zwischen Dokumenten, die sich aus den Textkorpi ergeben („Siehe auch“-Funktion nach Relevanz). Es gibt eine Reihe unterschiedlicher Varianten der Software mit aufsteigendem Preis nach Leistungsumfang, von ca. 47 Euro bis 142 Euro. Es lassen sich auch RSS-Feeds, E-Mails, Textfragmente oder Websites archivieren, dafür stehen diverse Plugins für Webbrowser oder Apple-Scripts zur Automatisierung  zur Verfügung. PDF-Dokumente lassen sich mit Anmerkungen versehen oder deren Schlüsselwörter nach Frequenz, Länge und Gewicht anzeigen. Die teuerste („Office-„)Variante hat die bekannte Engine von ABBYY FineReader zur Texterkennung integriert und kann den Zugriff auf die Datenbank(en) über einen Webserver bereitstellen – interessant für die Arbeit im Team und sei es nur zu Recherchezwecken.

Was bei mir beiden Produkten noch aufgefallen ist: Sieht so aus, als würde schon seit längerem (Mitte 2016) an jeweils einem neuen Major-Release gearbeitet. Wer also ein Händchen dafür hat (hust), Software stets 3 Tage vor dem neuen Release zu kaufen, sei gewarnt.

Mal sehen, was die nächsten Tage des Testzeitraums an neuen Erkenntnissen liefern.

Tag 354/2016: 1 Mal hinschauen, sofort geblockt

Ich schau mir gerade die WHOIS-Einträge aller IP-Adressen an, die auf einem meiner Hobby-VPS in die „ufw-blocker“-Falle getappt sind.

„ufw-blocker“ ist ein einfacher fail2ban-Filter, der in der syslog-Datei nach von der ufw-Firewall geblockten Einträgen sucht:

[Definition]
failregex = ^.*\[UFW BLOCK\] .*SRC=<HOST>.*$

Wahlweise nach einem oder zwei Versuchen (z.B. Tests auf Telnet-Port, allgemeine Port-Scans etc.) werden erneute Anfragen von der entsprechenden IP-Adresse für ein paar Stunden abgewiesen. Macht mit zunehmendem IPv6 natürlich irgendwann keinen Sinn mehr, aber aktuell gehts noch).

Damit man sich nicht selbst aussperrt bzw. Leute, die Zugriff haben dürfen, ist die „ignoreip“-Direktive mit diversen IP-Adressen gewhitelisted.

Als „banaction“ verwende ich immer die effiziente „iptables-ipset-proto6-allports.conf“, in der eine minimal angepasste Anweisung die IP-Adressen in die raw-Tabelle schiebt:

actionstart = ipset create fail2ban-<name> hash:ip
 iptables -t raw -A PREROUTING -m set --match-set fail2ban-<name> src -j DROP

Dadurch wird das Connection-Tracking umgangen; Informationen, dass die IP z.B. erneut geblockt wurde, interessieren mich im Logfile nicht – sondern rohe Geschwindigkeit beim Ablehnen. Eine Angewohnheit nach DDoS-Vorfällen.

Die IP-Adressen liste ich dann z.B. via „ipset list fail2ban-ufw-blocker“ auf:

Name: fail2ban-ufw-blocker
Type: hash:ip
Revision: 4
Header: family inet hashsize 1024 maxelem 65536
Size in memory: 896
References: 1
Members:
211.36.yyy.xxx
42.117.yyy.xxx
223.241.yyy.xxx
59.127.yyy.xxx
31.203.yyy.xxx
109.49.yyy.xxx
61.240.yyy.xxx
220.134.yyy.xxx

Und aus den WHOIS-Einträgen ergibt sich u.a. Seoul, Vietnam, 2x China, Kuwait, Lissabon, Taiwan…

The usual visits.

Tag 347/2016: Wenn ein Haus ein Betriebssystem wäre

Dann käme zu irgendeiner Uhrzeit und unvermittelt, sagen wir Sonntag 21:37 Uhr, eine Durchsage: „Update für Haustür verfügbar. Die Nutzung der Haustür unterliegt dem/den ursprünglichen Lizenzvertrag/-verträgen der aktualisierten Haustür“.

Na, die Haustür ist wichtig, also macht man das Update. Man kann die Haustür während des Updatevorgangs weiter benutzen, aber sie lässt sich nicht mehr so leicht öffnen und schließen. Irgendwann wirkt sie dann etwas neuer, aber was genau jetzt anders ist oder besser geht: keine Ahnung.

Manchmal gibt es dann auch ein Update fürs ganze Haus. Alle Bewohner müssen raus, weil ganz viele verschiedene Dinge gemacht werden, z.B. ein Blower door Test und die Fassade streichen. Das dauert dann Stunden, man kann nichts machen und danach sieht alles irgendwie brüchig aus, wenn man Pech hat. Also wirds nochmal komplett abgerissen und der Zustand von vor ein paar Jahren wird wiederhergestellt, weil man leider nur ein paar veraltete Baupläne und Fotos hatte.

Tag 346/2016: Plakate

Auf den Bus gewartet, vor der Alten Mälze, derweil die Plakate betrachtet: Das obligatorische Veranstaltungsdauerbrennerplakat – hier „Caveman“ – ist das einzige, an das ich mich jetzt noch erinnern kann.

Da gibts wahrscheinlich einen Zusammenhang. Bei den anderen war mir nicht immer gleich klar, ob es sich beim beworbenen Dings um eine Band, Kabarett oder was anderes handelt. Plakate werden ja fast immer so designt, dass sie keine Neukunden werben, sondern nur eine Erinnerung sein sollen, für die, die den Brand schon kennen.

Könnte man auch anders machen.

Tag 289/2016: Briefumschlag mit Vokalen vollkritzeln

Bislang viel zu wenig geübt. Immerhin hat sich beim „ka“ die Eselsbrücke Jo-Ka! („Joker“) schon eingebrannt (leicht zu finden auf dem Bild). Meine japanischen Mitbrüder und Mitschwestern mögen bitte die Sauklaue entschuldigen, ich hatte gerade keinen Federkiel zur Hand.

Tag 275/2016: Vorbereitungen für die Japanisch-Challenge

Nachdem die Jagd nun beginnt, habe ich auf meinem Computer gleich mal unter Systemeinstellungen -> Sprache & Region Japanisch hinzugefügt.

Jetzt steht mir eine kleine Sprachflagge als Menüpunkt zur Auswahl. Damit kann ich in ein paar Apps (Sorry, heute ist es ja schick, alles „App“ zu nennen, also mach ich auch mal mit, wenn auch mit Bauchschmerzen) wie Pages oder Textedit Hiragana und Katakana tippen.

Ansonsten hab ich noch eine Vorlesung rausgekramt, Computer Mathematics I: Components of a Computer. Die eingeblendeten Untertitel sind wohl ein typischer Hiragana-Katakana-Kanji-Mix. Vielleicht hör ich mir das drei Tage lang immer eine Stunde zum Einschlafen an, um besser in die Sprache einzutauchen. Mal sehn.

Ludi incipiant, Waltar v. d. Voglwaide!

Tag 256/2016: Menschliche Kommunikation

Geht doch nichts über Kultbücher für den täglichen Gebrauch.

Spannender als jeder Tatort. Aufregender als die Knoff-Hoff-Show. Mehr A-ha-Momente als in der Sendung mit der Maus. Stressiger als 24. Dauernd hört man sich „Genau!“ oder „Absolut!“ rufen.

Heute: Menschliche Kommunikation. Formen, Störungen, Paradoxien.

Auf der Zunge zergehen lassen: „Formen“, „Störungen“, „Paradoxien“.

Danke, Paul W.

Tag 205/2016: MIT Challenge

Can you get an MIT Education for $2.000?

MIT Challenge

Scott H. Young hat auf seiner Projektseite zusammengefasst, was ihn motiviert hat in 12 Monaten ein 4-Jahres-Curriculum des MIT in Computerwissenschaften zu stemmen, wie er es angepackt und letztendlich geschafft hat.

Die Aktion ist schon ein paar Jahre her, bin heute nur beim Wühlen in alten Newslettern wieder drauf gestoßen.