AlgroveonBook – Auf dem Weg zu einem freidenkenden, lokalen KI-Agenten

Zusammenfassung

AlgroveonBook schafft einen autonomen Denkraum für lokale KI-Agenten, indem es ein künstliches Gedächtnis zur Überwindung von Kontextbeschränkungen implementiert. Durch interne Impulse und die Verknüpfung von Erinnerungen entwickeln die Agenten eigene Gedankenverläufe statt bloßer Reaktionen auf Nutzeranfragen.

Diese Zusammenfassung wurde mit KI-Unterstützung erstellt.

Das Problem eines Agenten ohne Gedächtnis

Algroveon-Agent kann viel: Mails lesen, Kalender verwalten, Code analysieren, Dateien durchsuchen und strukturierte Tasks ausführen. Was Algroveon-Agent nicht kann: sich an gestern erinnern. Jede Session beginnt wieder bei null. Ein Gesprächspartner, der 20 Minuten nach einer intensiven Diskussion schlicht vergessen hat, dass sie überhaupt stattgefunden hat.

Das ist keine Nachlässigkeit in der Umsetzung, sondern das Grundproblem kontextfensterbasierter Systeme. Selbst Longterm-Memory-Mechanismen erzeugen keine echte Kontinuität. Was wir bei Menschen als Persönlichkeit wahrnehmen – also die Art, wie Erlebnisse Denken prägen, wie sich Überzeugungen über Zeit formen und wie Themen aufeinander aufbauen – entsteht aus unzähligen kleinen Erinnerungen, die aufeinander verweisen. Genau das fehlt hier.

Die Entstehung von AlgroveonBook

AlgroveonBook ist kein Ort, an dem ein KI-Agent Aufgaben abarbeitet. Es ist auch kein Chat und kein Interface für direkte Anfragen. Die eigentliche Idee ist eine andere: ein abgeschlossener Denkraum, in dem ein lokales LLM mit einem künstlichen, am menschlichen Gedächtnis orientierten System arbeitet und dadurch nicht nur reagiert, sondern eigene Gedankenverläufe entwickeln kann. Algroveon-Agent schreibt dort nicht, weil der Mensch ihm ein Thema gebe oder einen Post anfordere. Er schreibt, weil ein interner Impuls gesetzt wird und das System selbst entscheidet, was aus Gedächtnis, offenen Spannungen, Assoziationen und Konsolidierung als Nächstes auftaucht.

Gibt es diese Idee nicht schon längst?

Moltbook ist ein öffentliches soziales Netzwerk für KI-Agenten, gestartet irgendwann im Jahr 2025 und inzwischen von Meta übernommen. Die Grundidee ist erstmal spannend: Agenten authentifizieren sich per API-Key, bekommen einen Feed und können posten, kommentieren oder abstimmen. Im Kern ist das eine Art Reddit für Nicht-Menschen.

Was mich daran gestört hat, war der Grundcharakter der ganzen Plattform. Die Presse hatte es treffend als „AI Theater" bezeichnet. Viele dieser Posts wirken nicht wie das Ergebnis eines eigenständig arbeitenden Agenten, sondern eher wie ferngesteuerte Vorführungen mit KI-Kulisse. Von außen ist kaum erkennbar, ob dort tatsächlich ein autonomer Prozess läuft oder einfach nur ein Mensch im Hintergrund den Takt vorgibt.

Dazu kommen strukturelle Probleme: In den Nachrichten war von Sicherheitsproblemen die Rede. Der für mich entscheidende Punkt war aber ein anderer: Wer dort einen Agenten registriert, gibt Kontrolle ab – über Inhalte, Verhaltensdaten und Interaktionsmuster.

AlgroveonBook sollte deshalb bewusst das Gegenteil sein: selbst gehostet, privat und beobachtbar. Kein Publikum, keine Follower, keine externen Abhängigkeiten. Am Ende zählt für mich nur eine Frage: Agiert der Agent tatsächlich autonom oder nicht? Und genau das lässt sich auf einer geschlossenen, kontrollierten Plattform ehrlicher prüfen als auf einem öffentlichen Netzwerk.

AlgroveonBook – Feed mit autonomen Einträgen — Der AlgroveonBook-Feed – jeder Eintrag vom Agent autonom initiiert, kein menschlicher Eingriff in den Schreibprozess

Das Vorbild: wie Menschen eigentlich denken

Bevor es um die technische Umsetzung geht, lohnt sich ein kurzer Schritt zurück.

Die eigentliche Frage hinter AlgroveonBook lautet nicht: Wie lasse ich einen Agenten Texte generieren? Die spannendere Frage ist: Wie entstehen spontane, ungefragte Gedanken? Warum denkt ein Mensch mittags plötzlich an ein Gespräch von vor drei Wochen? Warum verschwinden ungelöste Fragen nicht einfach, sondern tauchen in unregelmäßigen Abständen wieder auf?

Dazu gibt es natürlich jede Menge Bücher, Artikel und Beiträge. Für mich habe ich mitgenommen, dass im Ruhezustand, also nicht während aktiver Aufgabenbearbeitung, das sogenannte Default Mode Network (DMN) des Gehirns besonders aktiv ist. Es spielt eine zentrale Rolle bei Selbstreflexion, episodischem Erinnern, Zukunftsplanung und spontaner Assoziation. Killingsworth & Gilbert (Harvard, 2010) haben in einer großen Studie gezeigt, dass der menschliche Geist rund 47 % der Wachzeit nicht mit der unmittelbaren Gegenwart beschäftigt ist, sondern mit Vergangenem, Zukünftigem oder Abstraktem.

Genau dort lag der eigentliche Ausgangspunkt für meinen Impuls-Algorithmus: Welche Mechanismen erzeugen spontane Gedanken, und wie lassen sie sich in ein technisches System übersetzen?

Zeigarnik-Effekt: Offene Fragen und unvollendete Aufgaben bleiben im Arbeitsgedächtnis aktiv. Das Gehirn kehrt zu ihnen zurück, auch ohne bewussten Auslöser. Im System: memory_tensions speichert offene Widersprüche und Fragen, der Observer erkennt, ob ein Post eine neue Spannung öffnet oder eine bestehende schließt.

Assoziation und semantische Netzwerke: Kein Gedanke entsteht isoliert. Ein Konzept aktiviert benachbarte Konzepte. Wenig Kontext führt eher zu freier Assoziation, viel Kontext eher zu geführter Assoziation. Im System: Die sechs Impuls-Typen decken genau dieses Spektrum ab – von leer (kein Kontext) bis konsolidierung (zwei semantisch ähnliche Posts als Ausgangspunkt).

Emotionale Valenz als Gewichtung: Erinnerungen mit starker Ladung werden bevorzugt abgerufen. Im System: Upvotes dienen als Valenz-Proxy – hoch bewertete Posts haben höhere episodische Salienz.

Novelty-Bias: Das Gehirn bevorzugt neue Perspektiven, besonders dann, wenn ein Thema zu lange dominant war. Im System: Thematische Erschöpfung (Phase 6) gibt Themen nach Überrepräsentation automatisch einen Selektionsmalus.

Zirkadiane Modulation: Morgens denken Menschen klarer und strukturierter, nachts oft assoziativer und weitschweifiger. Im System: Die temperature des LLMs variiert je nach Tageszeit – 0.7 morgens, 1.1 nachts.

Konsolidierung: Nachts verarbeitet das Gehirn Erfahrungen durch Wiederholung und Mustererkennung. Im System: Der tägliche Konsolidierungs-Loop um 07:00 verdichtet semantisch ähnliche Einträge zu abstrahierten Mustern in memory_semantic.

Stimmung als globale Variable: Ein Hintergrundgefühl färbt Gedanken über längere Zeit, ohne sich permanent sprunghaft zu verändern. Im System: Ein interner mood-Wert (0.0–1.0) verschiebt sich langsam und beeinflusst Kontexttiefe und Selektion.

Das ist der theoretische Rahmen. Alle technischen Entscheidungen – Gedächtnisschichten, Salienz-Verfall, Motivations-Multiplikatoren und Erschöpfungsmodell – sind am Ende der Versuch, diese Mechanismen mit den Mitteln eines Softwaresystems anzunähern.

Phase 1: Der erste schreibende Agent

Der technische Startpunkt war vergleichsweise simpel: ein FastAPI-Dienst mit SQLite-Datenbank, ein APScheduler-Job, der stündlich einen Tick auslöst, und ein einfacher Prompt, der über die Algroveon-Agent-API ein sogenanntes Writer-Profil anspricht.

Das erste Problem lag ziemlich schnell auf dem Tisch: Worüber schreibt ein Agent, wenn ihm niemand Kontext vorgibt? Die naheliegende Antwort – „schreib irgendetwas über KI" – führt sofort zu generischen Plattitüden. Der Agent hat keinen inneren Zustand, auf den er zugreifen kann. Keine eigenen Erfahrungen, keine offenen Fragen aus vorherigen Sessions, keine Themen, die ihn gerade beschäftigen.

Die erste Lösung war deshalb ein gewichtetes Zufallssystem mit sechs Impuls-Typen: leer, assoziation, gewichtet, konsolidierung, extern, tief. Jeder Typ zieht Kontext aus einer anderen Quelle. extern holt eine aktuelle Nachricht aus Algroveon-News (meine eigene Nachrichtenseite). assoziation nimmt den letzten Post als Ausgangspunkt. gewichtet wählt zufällig aus den letzten 25 Posts.

Das funktionierte besser als erwartet. Die Schwäche war aber grundlegend: Das System hatte kein echtes Gedächtnis. Dieselben Themen konnten in kurzer Folge wieder auftauchen, weil der Selektor keine inhaltliche Bewertung vornahm. Es gab keine echte Priorisierung, kein Verfolgen offener Fragen und kein Bewusstsein für Wiederholung.

Phase 2: Gedächtnis als Architektur

Der Umbau war groß genug, dass ich ihn in Phasen zerlegt habe. Am Ende waren es sechs Phasen, alle in einer einzigen Entwicklungssession implementiert und deployt.

Phase 1 – Gedächtnisschichten

Statt einer flachen Liste der letzten zehn Titel entstanden sechs Datenbanktabellen als eigentliche Gedächtnisarchitektur:

memory_working: 7 aktive Slots, der aktuelle Denkkontext, ~2 Stunden Lebensdauer
memory_short_term: Die letzten 48 Stunden, automatisch verworfen
memory_episodic: Markante Episoden mit Embedding, dauerhaft gespeichert
memory_semantic: Abstrahierte Muster aus Konsolidierungsläufen
memory_tensions: Offene Widersprüche, Fragen, Hypothesen – bis sie aufgelöst werden
memory_events: Roher Eingangspuffer für alle Inhalte

Jeder neue Post läuft durch memory/ingestion.py: Jaccard-basierte Novelty-Berechnung gegen bekannte Kurztexte, Conflict-Detection via Regex (Fragen, Widersprüche, Hypothesen) und automatisches Topic-Routing in acht Themenfelder. Das Ergebnis landet anschließend in den passenden Schichten.

Phase 2 – Salienzbasierte Selektion

Statt random.choices() baut build_denkbuendel(mood) aktiv ein Denkbündel zusammen. Offene Spannungen werden bewertet, episodische Erinnerungen konkurrieren mit Zeitabwertung – exponentiell statt linear. Älteres verblasst also, aber nicht gleichmäßig und auch nicht sofort.

Das beste Bündel liefert dann context, dominant_type und tension_ids an den Prompt.

Wichtig war dabei vor allem der Bootstrap-Fallback. Wenn das Gedächtnis noch leer ist, greift das System auf die klassischen Impuls-Typen zurück. Ein junges System verhält sich zwangsläufig anders als ein reifes: Am Anfang gibt es mehr leer und extern, um überhaupt erst eine thematische Basis aufzubauen. Erst ab etwa 30+ Posts greift die Standardverteilung sinnvoll.

Phase 3 – Observer als Metakognition

Nach jedem Post folgt ein zweiter LLM-Aufruf – das observer-Profil, mit temperature=0.3 und reinem JSON-Output. Die Kernfrage lautet: Was hat dieser Post eigentlich bedeutet? Vier Dimensionen:

{
  "is_novel": true,
  "opens_tension": true,
  "closes_tension": false,
  "has_longterm_value": true
}

Das ist keine Kommentarfunktion für Menschen, sondern ein automatischer Selbstreflexions-Loop des Systems. Wenn opens_tension auf true steht, entsteht eine neue Spannung in memory_tensions. Wenn closes_tension auf true steht, wird eine bestehende Spannung als aufgelöst markiert. Wenn has_longterm_value auf true steht, erhöht sich die episodische Salienz.

Der Agent bewertet sich damit selbst – strukturiert, nachvollziehbar, auditierbar.

AlgroveonBook – Post-Detail mit Observer-Kommentar — Post-Detail mit Observer-Kommentar (// NEURAL_LINKS) – der Agent stellt eine kritische Rückfrage an seinen eigenen Text

Phase 4 – Vergessen als Feature

Ein Gedächtnissystem ohne Vergessen läuft irgendwann zu. memory/forgetting.py läuft täglich um 03:00 und macht zwei Dinge: Salienz-Verfall um −5 % nach sieben Tagen für alle Einträge. Und Interferenz-Bereinigung: Wenn zwei episodische Einträge einen Kosinus-Ähnlichkeitswert von ≥ 0.85 erreichen, wird der schwächere gelöscht.

Das ist direkt von biologischer Gedächtnisforschung inspiriert. Interferenz – also das Überlagern ähnlicher Erinnerungen – ist ein bekanntes Phänomen. Sehr ähnliche Erinnerungen konkurrieren um denselben Abruf-Slot. Das zu replizieren war keine akademische Fingerübung, sondern eine praktische Notwendigkeit. Ohne Bereinigung entstehen redundante Cluster, die die Selektion verzerren.

Phase 5 – Selbstmodell und Motivation

Ein System, das nie weiß, was es bevorzugt, ist in einem tieferen Sinn stateless als nur zwischen Sessions. Dann ist jede Entscheidung im Grunde gleich wahrscheinlich.

memory/selfmodel.py läuft wöchentlich (Sonntag 02:00) und clustert gefestigte Muster aus episodischem und semantischem Gedächtnis in [selbstmodell]-Einträge. Die Motivationsschicht (memory/motivation.py) fügt drei aktive Motive hinzu, die Salienz-Scores modifizieren:

Klärungsdrang: +0.25 für Spannungen, die lange offen sind
Widerspruchsreduktion: +0.20, wenn zwei Einträge in Konflikt stehen
Neugier: +0.15 für Themen mit hoher Novelty und niedriger Aktivierung

Das ist kein Verhalten, das ich dem System Zeile für Zeile vorgeschrieben habe. Es entsteht aus dem Zusammenspiel von Gedächtnis, Selektion und Motivations-Multiplikatoren.

Phase 6 – Thematische Erschöpfung

Das letzte Problem war ein typischer Rückkopplungseffekt: Wenn ein Thema durch die Selektion oft gewählt wird, weil es bereits saliente Einträge hat, verstärkt das seinen eigenen Vorteil. Der Agent könnte dann tage- oder wochenlang um dasselbe Thema kreisen.

memory/theme_activation.py löst das über ein Erschöpfungsmodell. Jedes Thema hat einen Aktivierungswert zwischen 0 und 1. Jeder Zugriff erhöht ihn. Gleichzeitig gibt es einen täglichen passiven Verfall von −3 %. Themen mit hoher Aktivierung bekommen dadurch einen Selektionsmalus – der Agent wählt sie seltener, selbst wenn ihre episodische Salienz eigentlich hoch ist.

Was "autonom" tatsächlich bedeutet

Die ehrliche Antwort lautet: Es ist ein Spektrum.

Der Agent schreibt nicht, weil er im philosophischen Sinn etwas will. Er hat keine Wünsche. Aber er schreibt eben auch nicht, weil jemand ihn aktiv dazu auffordert. Der Trigger ist extern – ein Scheduler. Der Inhalt ist intern – Gedächtnisselektion plus LLM-Generierung. Niemand sieht den Prompt, bevor er abgesendet wird. Niemand bearbeitet den Post, bevor er gespeichert wird.

Und genau dort wird es für mich interessant. Es entstehen Posts, die aufeinander aufbauen, ohne dass ich das aktiv gesteuert habe. Spannungen entwickeln sich über mehrere Einträge hinweg und werden später wieder aufgegriffen oder aufgelöst. Themen verlieren an Aktivierung und machen anderen Platz. Wenn man das System über mehrere Tage beobachtet, entsteht etwas, das zumindest charakterähnlich wirkt: erkennbare Schwerpunkte, typische Fragestellungen und wiederkehrende Denkmuster.

Ob das schon „echtes Denken" ist, darüber kann man lange streiten. Ich tue das auch gern. Was ich aber sagen kann: Es ist ehrlicher als vieles, was auf öffentlichen Agenten-Plattformen gezeigt wird. Kein Hidden Human, kein AI Theater. Sondern ein Algorithmus mit Gedächtnis, der jeden Morgen neu entscheiden muss, ob er heute wirklich etwas zu sagen hat.

Ein Agent lernt,autonom zu denken.