Zum Hauptinhalt springen

GitHub - yichuan-w/LEANN: RAG auf allem mit LEANN. Genießen Sie 97% Speicherersparnis, während Sie eine schnelle, genaue und 100% private RAG-Anwendung auf Ihrem persönlichen Gerät ausführen.

·1096 Wörter·6 min
GitHub Python Open Source
Articoli Interessanti - Dieser Artikel ist Teil einer Serie.
Teil : Dieser Artikel
Teil : Prompt Packs | OpenAI Academy --- **Willkommen bei den Prompt Packs der OpenAI Academy!** Hier finden Sie eine Sammlung von sorgfältig kuratierten Prompt-Packs, die Ihnen helfen, das volle Potenzial von Sprachmodellen zu nutzen. Diese Packs sind so gestaltet, dass sie Ihnen bei verschiedenen Aufgaben und Anwendungen unterstützen, sei es für kreative Schreibprojekte, technische Dokumentationen oder die Erstellung von Inhalten für soziale Medien. --- **Warum Prompt Packs verwenden?** Prompt Packs bieten eine strukturierte und effiziente Möglichkeit, Sprachmodelle zu nutzen. Sie sparen Zeit und Mühe, indem sie vorgefertigte Prompts bereitstellen, die auf bewährten Methoden und Best Practices basieren. Egal, ob Sie ein Anfänger oder ein erfahrener Benutzer sind, diese Packs bieten wertvolle Ressourcen, um Ihre Produktivität zu steigern und die Qualität Ihrer Ausgaben zu verbessern. --- **Wie funktionieren Prompt Packs?** Jedes Prompt Pack enthält eine Reihe von Prompts, die speziell für bestimmte Anwendungen oder Aufgaben entwickelt wurden. Diese Prompts sind so gestaltet, dass sie das Sprachmodell anleiten, die gewünschten Ergebnisse zu erzeugen. Sie können die Prompts an Ihre spezifischen Bedürfnisse anpassen und so die Leistung des Modells optimieren. --- **Verfügbare Prompt Packs** - **Kreatives Schreiben**: Entdecken Sie Prompts, die Ihnen helfen, Geschichten, Gedichte und andere kreative Texte zu erstellen. - **Technische Dokumentation**: Nutzen Sie Prompts, die speziell für die Erstellung technischer Dokumentationen, Handbücher und Anleitungen entwickelt wurden. - **Soziale Medien**: Erstellen Sie ansprechende Inhalte für soziale Medien mit Prompts, die auf Engagement und Reichweite optimiert sind. - **Marketing und Werbung**: Entwickeln Sie überzeugende Marketingtexte und Werbekampagnen mit gezielten Prompts. - **Bildung und Lernen**: Nutzen Sie Prompts, die Ihnen helfen, Lernmaterialien, Quizfragen und Lernpläne zu erstellen. --- **Erstellen Sie Ihr eigenes Prompt Pack** Sie können auch Ihre eigenen Prompt Packs erstellen und mit der Community teilen. Nutzen Sie die Flexibil
LEANN MCP Integration
#### Quelle

Typ: GitHub Repository
Originaler Link: https://github.com/yichuan-w/LEANN?tab=readme-ov-file
Veröffentlichungsdatum: 2026-01-06


Zusammenfassung
#

Einführung
#

Stellen Sie sich vor, Sie sind ein Forscher, der Tausende von Dokumenten verschiedener Art analysieren muss, darunter wissenschaftliche Artikel, E-Mails und Unternehmensberichte. Jedes Mal, wenn Sie nach spezifischen Informationen suchen, finden Sie sich in unorganisierten Dateien wieder und verlieren wertvolle Stunden. Stellen Sie sich nun vor, Sie hätten ein System, das Millionen von Dokumenten schnell und genau indizieren und durchsuchen kann, alles auf Ihrem Laptop, ohne Ihre Daten jemals an einen entfernten Server zu senden. Genau das bietet LEANN, ein Open-Source-Projekt, das die Art und Weise, wie wir Informationen verwalten und abrufen, revolutioniert.

LEANN ist eine innovative Vektordatenbank, die Ihren Laptop in ein leistungsfähiges Retrieval-Augmented Generation (RAG)-System verwandelt. Dank fortschrittlicher Indizierungs- und semantischer Suchtechniken ermöglicht LEANN Ihnen, genau das zu finden, was Sie benötigen, in wenigen Sekunden, und spart bis zu 97% des Speicherplatzes im Vergleich zu traditionellen Methoden. Es ist nicht nur ein Tool für Entwickler, sondern eine praktische Lösung für jeden, der große Datenmengen effizient und sicher verwalten muss.

Was es macht
#

LEANN ist eine Vektordatenbank, die sich auf die Verwaltung und Suche von Informationen lokal und privat konzentriert. Praktisch ermöglicht LEANN Ihnen, Millionen von Dokumenten direkt auf Ihrem Gerät zu indizieren und zu durchsuchen, ohne Daten an entfernte Server senden zu müssen. Dies ist besonders nützlich für Personen, die mit sensiblen Daten arbeiten oder die vollständige Kontrolle über ihre Informationen behalten möchten.

Eine der Hauptfunktionen von LEANN ist seine Fähigkeit, Speicherplatz zu sparen. Dank Techniken wie graph-based selective recomputation und high-degree preserving pruning berechnet LEANN die Embeddings nur bei Bedarf, anstatt alle Vektoren zu speichern. Dies reduziert nicht nur den Speicherplatzverbrauch, sondern macht das System auch schneller und reaktionsfähiger.

LEANN ist mit verschiedenen Indizierungs-Backends kompatibel, wie HNSW (Hierarchical Navigable Small World), und unterstützt die semantische Suche, sodass Sie Informationen intuitiver und genauer finden können als mit keywordbasierten Suchmethoden. Darüber hinaus ist LEANN so konzipiert, dass es einfach in bestehende Projekte integriert werden kann und eine einfache und intuitive Schnittstelle für Entwickler und Endnutzer bietet.

Warum es besonders ist
#

Das “Wow”-Element von LEANN liegt in seiner Fähigkeit, ein leistungsfähiges und privates semantisches Suchsystem direkt auf Ihrem Gerät anzubieten. Es ist kein einfaches keywordbasiertes Suchwerkzeug, sondern ein System, das den Kontext und die Bedeutung der gesuchten Informationen versteht.

Dynamisch und kontextuell: LEANN verwendet fortschrittliche Indizierungstechniken, die es ermöglichen, die Embeddings nur bei Bedarf zu berechnen. Dies bedeutet, dass das System immer auf dem neuesten Stand ist und in der Lage ist, Ihre Fragen genau zu beantworten. Zum Beispiel, wenn Sie nach Informationen zu einem bestimmten Projekt suchen, kann LEANN Ergebnisse zurückgeben, die den Kontext berücksichtigen, in dem Sie arbeiten, und die Suche relevanter und nützlicher machen.

Echtzeit-Rückschlüsse: Dank seiner Fähigkeit, die Embeddings in Echtzeit zu berechnen, kann LEANN komplexe Fragen schnell und genau beantworten. Stellen Sie sich vor, Sie müssen ein großes E-Mail-Dataset analysieren, um eine betrügerische Transaktion zu finden. Mit LEANN können Sie fragen “Welche E-Mails enthalten verdächtige Transaktionen?” und sofortige Ergebnisse erhalten, ohne dass das System alle Daten verarbeiten muss.

Vollständige Privatsphäre: Einer der größten Vorteile von LEANN ist sein Fokus auf die Privatsphäre. Alle Ihre Daten bleiben auf Ihrem Gerät, ohne jemals an entfernte Server gesendet zu werden. Dies ist besonders wichtig für Personen, die mit sensiblen Informationen arbeiten oder die vollständige Kontrolle über ihre Daten behalten möchten. Wie einer der Entwickler sagte: “Hallo, ich bin dein System. Der Dienst X ist offline, aber ich kann dir trotzdem helfen, die gesuchten Informationen zu finden.”

Effizienz ohne Kompromisse: LEANN spart bis zu 97% des Speicherplatzes im Vergleich zu traditionellen Methoden. Dies bedeutet, dass Sie Millionen von Dokumenten indizieren und durchsuchen können, ohne sich Gedanken über den verfügbaren Speicherplatz auf Ihrem Gerät machen zu müssen. Zum Beispiel kann ein Datensatz von 60 Millionen Textfragmenten in nur 6GB indiziert werden, im Vergleich zu den 201GB, die mit traditionellen Methoden erforderlich sind.

Wie man es ausprobiert
#

LEANN auszuprobieren ist einfach und direkt. Hier ist, wie Sie beginnen können:

  1. Voraussetzungen: Stellen Sie sicher, dass Python 3.9 oder höher auf Ihrem System installiert ist. LEANN unterstützt Ubuntu, Arch, WSL, macOS (ARM64/Intel) und Windows. Sie finden die detaillierten Installationsanweisungen für die Voraussetzungen im README des Projekts.

  2. Installation: Klonen Sie das LEANN-Repository von GitHub mit dem Befehl git clone https://github.com/yichuan-w/LEANN.git. Sobald geklont, folgen Sie den Anweisungen im README, um die erforderlichen Abhängigkeiten zu installieren.

  3. Konfiguration: Konfigurieren Sie Ihre Entwicklungsumgebung gemäß den Anweisungen im README. Dies umfasst die Installation von Paketen wie boost, protobuf, abseil-cpp, libaio, zeromq und anderen.

  4. Ausführung: Sobald die Umgebung konfiguriert ist, können Sie mit der Verwendung von LEANN beginnen. Hier ist ein Beispiel, wie Sie einen Index erstellen und eine Suche durchführen:

from leann import LeannBuilder, LeannSearcher, LeannChat
from pathlib import Path
INDEX_PATH = str(Path("./").resolve() / "demo.leann")

# Build an index
builder = LeannBuilder(backend_name="hnsw")
builder.add_text("LEANN saves 97% storage compared to traditional vector databases.")
builder.add_text("Tung Tung Tung Sahur called—they need their banana-crocodile hybrid back")
builder.build_index(INDEX_PATH)

# Search
searcher = LeannSearcher(INDEX_PATH)
results = searcher.search("fantastical AI-generated creatures", top_k=1)

# Chat with your data
chat = LeannChat(INDEX_PATH, llm_config={"type": "hf", "model": "Qwen/Qwen3-0.6B"})
response = chat.ask("How much storage does LEANN save?", top_k=1)
  1. Dokumentation: Für weitere Details konsultieren Sie die offizielle Dokumentation, die im Repository verfügbar ist. Die Dokumentation deckt alle Aspekte des Projekts ab, von fortgeschrittenen Funktionen bis hin zu Best Practices für die Nutzung.

Abschließende Gedanken
#

LEANN stellt einen bedeutenden Fortschritt im Bereich der semantischen Suche und Datenverwaltung dar. Seine Fähigkeit, ein leistungsfähiges und privates Suchsystem direkt auf dem Gerät des Benutzers anzubieten, macht es zu einer idealen Lösung für jeden, der große Mengen an Informationen effizient und sicher verwalten muss.

Im weiteren Kontext des Tech-Ökosystems positioniert sich LEANN als ein innovatives Projekt, das den Zugang zur künstlichen Intelligenz demokratisiert. Sein Fokus auf Privatsphäre und Effizienz macht es zu einer interessanten Wahl für Entwickler, Forscher und Endnutzer, die praktische und sichere Lösungen für die Datenverwaltung suchen.

Abschließend ist LEANN nicht nur ein technologisches Werkzeug, sondern eine Vision der Zukunft, in der die Datenverwaltung einfach, effizient und vollständig unter der Kontrolle des Benutzers liegt. Mit LEANN ist das Potenzial, die Informationsverwaltung zu innovieren und zu verbessern, unbegrenzt.


Anwendungsfälle
#

  • Private AI Stack: Integration in proprietäre Pipelines
  • Client Solutions: Implementierung für Kundenprojekte
  • Development Acceleration: Reduzierung der Time-to-Market für Projekte

Ressourcen
#

Original Links #


Artikel empfohlen und ausgewählt vom Human Technology eXcellence Team, erstellt mit KI (in diesem Fall mit LLM HTX-EU-Mistral3.1Small) am 2026-01-06 09:30 Originalquelle: https://github.com/yichuan-w/LEANN?tab=readme-ov-file

Articoli Interessanti - Dieser Artikel ist Teil einer Serie.
Teil : Dieser Artikel
Teil : Prompt Packs | OpenAI Academy --- **Willkommen bei den Prompt Packs der OpenAI Academy!** Hier finden Sie eine Sammlung von sorgfältig kuratierten Prompt-Packs, die Ihnen helfen, das volle Potenzial von Sprachmodellen zu nutzen. Diese Packs sind so gestaltet, dass sie Ihnen bei verschiedenen Aufgaben und Anwendungen unterstützen, sei es für kreative Schreibprojekte, technische Dokumentationen oder die Erstellung von Inhalten für soziale Medien. --- **Warum Prompt Packs verwenden?** Prompt Packs bieten eine strukturierte und effiziente Möglichkeit, Sprachmodelle zu nutzen. Sie sparen Zeit und Mühe, indem sie vorgefertigte Prompts bereitstellen, die auf bewährten Methoden und Best Practices basieren. Egal, ob Sie ein Anfänger oder ein erfahrener Benutzer sind, diese Packs bieten wertvolle Ressourcen, um Ihre Produktivität zu steigern und die Qualität Ihrer Ausgaben zu verbessern. --- **Wie funktionieren Prompt Packs?** Jedes Prompt Pack enthält eine Reihe von Prompts, die speziell für bestimmte Anwendungen oder Aufgaben entwickelt wurden. Diese Prompts sind so gestaltet, dass sie das Sprachmodell anleiten, die gewünschten Ergebnisse zu erzeugen. Sie können die Prompts an Ihre spezifischen Bedürfnisse anpassen und so die Leistung des Modells optimieren. --- **Verfügbare Prompt Packs** - **Kreatives Schreiben**: Entdecken Sie Prompts, die Ihnen helfen, Geschichten, Gedichte und andere kreative Texte zu erstellen. - **Technische Dokumentation**: Nutzen Sie Prompts, die speziell für die Erstellung technischer Dokumentationen, Handbücher und Anleitungen entwickelt wurden. - **Soziale Medien**: Erstellen Sie ansprechende Inhalte für soziale Medien mit Prompts, die auf Engagement und Reichweite optimiert sind. - **Marketing und Werbung**: Entwickeln Sie überzeugende Marketingtexte und Werbekampagnen mit gezielten Prompts. - **Bildung und Lernen**: Nutzen Sie Prompts, die Ihnen helfen, Lernmaterialien, Quizfragen und Lernpläne zu erstellen. --- **Erstellen Sie Ihr eigenes Prompt Pack** Sie können auch Ihre eigenen Prompt Packs erstellen und mit der Community teilen. Nutzen Sie die Flexibil