/ KI-Beratung Wien

KI-Beratung,
mit Substanz.

Wir machen aus KI konkrete Use-Cases und sagen Ihnen ehrlich, wenn klassische Software für Ihr Problem besser passt. Auf Wunsch komplett On-Premise oder in der EU-Cloud.

Was wir unter „KI-Beratung“ verstehen

Drei sehr verschiedene Dinge laufen unter dem Begriff Künstliche Intelligenz: klassisches Machine Learning (Klassifikation, Forecasting), generative Large Language Models (Text, Code, Übersetzung), und Hybrid-Systeme wie RAG (Retrieval Augmented Generation), die LLMs mit Ihrem Unternehmens-Wissen kombinieren.

Welches davon Sie brauchen, und ob überhaupt, hängt vom Use-Case ab. Wir starten mit Ihrem Problem, nicht mit der Technologie.

Typische Use-Cases in Unternehmen

Warum On-Premise für viele Kunden alternativlos ist

Wenn Sie mit Patientendaten, Behörden-Akten, Verträgen oder geschäftskritischem Know-how arbeiten, ist die Übertragung an US-Cloud-LLMs (OpenAI, Anthropic, Google) entweder rechtlich nicht zulässig (DSGVO, Branchen­vorschriften) oder wettbewerblich nicht klug (Wettbewerber lernen mit).

Open-Source-Modelle wie Llama 3.x oder Mistral erreichen mittlerweile Qualitäten, die für viele Unternehmensanwendungen vollkommen ausreichen und können auf einer eigenen GPU-Maschine in Ihrem Rechenzentrum laufen. Wir konzipieren, dimensionieren und betreiben solche Setups.

Unser Vorgehen

Was wir Ihnen NICHT verkaufen

Wir verkaufen Ihnen kein „KI-Audit“ über 20.000 € mit einer 120-seitigen Power­Point ohne Code. Wir verkaufen Ihnen keine generische ChatGPT-Integration, die in jeder Webagentur in zwei Tagen entsteht. Und wir verkaufen Ihnen kein KI-Projekt, wenn wir glauben, dass Ihr Problem mit klassischer Software effektiver gelöst ist.

Häufige Fragen

Was kostet eine On-Premise-KI-Lösung?
Hardware: ein GPU-Server mit 1 bis 2 NVIDIA RTX-Karten liegt bei 5.000 bis 10.000 € einmalig (Markt-Hardware-Preis, kein Aufschlag). Software-Konzeption und Setup: 8.000 bis 24.000 € je nach Komplexität. Integration in bestehende Systeme: zusätzlich. Laufende Wartung: 0,5 bis 1 Tag pro Monat. Über drei Jahre rechnet sich das gegenüber Cloud-LLM-Kosten meistens deutlich.
Welche LLMs setzen Sie ein?
Cloud (mit Einwilligung): Anthropic Claude, OpenAI GPT, Google Gemini. On-Premise: Llama 3.x, Mistral, Qwen, Phi. Die richtige Wahl hängt vom Use-Case ab. Für RAG-Systeme reichen oft kleinere Modelle (7B bis 13B) plus gute Embeddings; für freie Generierung braucht es größere Modelle (70B+).
Wie gehen Sie mit Halluzinationen um?
Drei Hebel: (1) RAG-Architektur mit harter Quellen-Pflicht. Das Modell darf nur antworten, wenn es eine Quelle zitieren kann. (2) Strukturierte Output-Validierung mit JSON-Schemas und Constrained Generation. (3) Transparenz: Antworten sind immer als KI-generiert gekennzeichnet, kritische Use-Cases haben Human-in-the-Loop.
Müssen wir vorher unsere Daten aufbereiten?
Meistens ja, aber weniger als befürchtet. Bei RAG genügt oft, dass Dokumente als PDF/Word/Markdown vorliegen. Ein guter Vector-Store kann mit Tabellen, Diagrammen und Layout umgehen. Bei Klassifikation brauchen wir typischerweise 200 bis 2000 gelabelte Beispiele; dabei helfen wir auch.
Wie lange dauert ein KI-Proof-of-Concept?
2 bis 4 Wochen. Am Ende sehen Sie ein funktionierendes System mit echten Daten, in einer Test-Umgebung. Auf Basis dessen entscheidet sich, ob ein produktiver Roll-Out sinnvoll ist.
Ist KI nicht in zwei Jahren wieder vorbei?
Die Aufregung wird weniger, die Technologie bleibt. LLMs werden 2026 so selbstverständlich wie Datenbanken. Wir bauen auf Open-Standards (OpenAI-API-kompatibel, ONNX), damit Sie nicht an einen Anbieter gebunden sind, falls sich der Markt verschiebt.

Ausgewählte Projekte

Lassen Sie uns reden.

30 Minuten Erstgespräch, eine ehrliche Einschätzung und kein Verkaufsdruck.

Erstgespräch vereinbaren