Verbessern der Agentqualität zur Optimierung der KI-Nutzung

Einleitung

Wenn Agenten klar abgegrenzt, klar instruiert und innerhalb klarer Leitplanken eingesetzt werden, verbessert sich die Tokeneffizienz ganz natürlich. Hochwertige Agents führen Aufgaben in weniger Versuchen aus, folgen klareren Workflows mit weniger Überarbeitungen und vermeiden teure Debugging- und Korrekturzyklen.

In diesem Artikel werden fünf Strategien vorgestellt, um sowohl die Qualität der Agenten als auch die AI creditsEffizienz zu verbessern:

1. Wählen Sie das richtige Modell für die richtige Aufgabe aus.

Die Wahl des Modells ist einer der schnellsten Wege, sowohl die Qualität der Agenten als auch die Kosteneffizienz zu verbessern, wird jedoch oft übersehen. Ein gängiges Muster besteht darin, für jede Aufgabe standardmäßig das fähigste Modell zu verwenden. Dies erhöht jedoch häufig die Tokennutzung, ohne das Ergebnis zu verbessern. In einigen Szenarien mit ausführungsintensiven Szenarien können überlastende Begründungsmodelle die Qualität verringern, da das Modell die Aufgabe möglicherweise überdenken oder unnötige Änderungen verursachen kann.

Wählen Sie das Modell je nach anstehender Aufgabe aus. Copilot Automatische Modellauswahl kann dies auch automatisch anhand des Systemzustands und der Leistung des Modells in Echtzeit übernehmen.

Begründungsmodelle: Am besten geeignet für Architekturentscheidungen, komplexes Debuggen, Systemdesign und Aufgaben, die eine tiefere Analyse erfordern.
Modelle der mittleren Leistungsklasse: Am besten geeignet, wenn der Plan bereits klar ist und der Agent effizient handeln muss.
Leichtere Modelle: Am besten geeignet für Umgestaltung, Formatierung, Dokumentationsaktualisierungen und andere routinebezogene Änderungen.

Verwenden Sie so viele Funktionen wie die Aufgabe und so wenig wie nötig. Die Zuordnung der richtigen Fähigkeiten zu den jeweiligen Aufgaben verbessert die Ergebnisse und hält die Kosten bei großem Umfang direkt unter Kontrolle.

Eine Aufschlüsselung nach Modell und Vorgangstyp finden Sie unter Vergleichen von KI-Modellen bei Verwendung unterschiedlicher Aufgaben.

2. Stellen Sie klare Anleitungen in Ihren Eingabeaufforderungen bereit.

Ihre Eingabeaufforderung legt die Richtung für alles fest, was der Agent tut. Wenn eine Eingabeaufforderung vage ist, muss der Agent die Absicht ableiten, mehr Kontext erkunden und Urteilsaufrufe tätigen. Das führt häufig zu erneuten Versuchen, einer schleichenden Ausweitung des Umfangs und unnötigem Tokenverbrauch.

Gut strukturierte Eingabeaufforderungen haben drei Qualitäten:

Eine klare Aufgabendefinition. Statt „Beheben Sie dieses Problem“ zu schreiben, erklären Sie, worin das Problem besteht, wo es auftritt und wie das erwartete Ergebnis aussieht.
Relevanter Kontext vorab bereitgestellt. Wenn Sie bereits wissen, welche Dateien, Dienste, Protokolle, Fehler oder Eingaben wichtig sind, fügen Sie sie ein. Dies hilft dem Agenten, unnötige Erkundungen zu vermeiden.
Eine klare Beendigungsbedingung. Teilen Sie dem Agent mit, wie "erledigt" aussieht. Ohne einen klaren Endpunkt können Agenten über das Ziel hinausschießen, indem sie zusätzliche Commits hinzufügen, nicht zusammenhängenden Code refaktorieren oder den Umfang erweitern.

Diese hinzugefügte Anleitung erhöht die Tokennutzung nicht sinnvoll, kann aber die Anzahl der Agentausführungen erheblich reduzieren, die erforderlich sind, um das richtige Ergebnis zu erreichen.

Bewährte Methoden für das Prompt Engineering finden Sie unter Prompt-Engineering für GitHub Copilot Chat.

3. Forschung, Plan, dann implementieren

Eine der größten Veränderungen bei der effektiven Arbeit mit Agenten besteht darin, nicht mehr alles in einer einzigen Sitzung zu erledigen. Wenn Forschung, Planung und Implementierung zusammen stattfinden, wächst der Kontext schnell, irrelevante Informationen sammeln sich an und die Agentqualität verschlechtert sich im Laufe der Zeit.

Teilen Sie die Arbeit in klare Phasen ein:

Forschung: Verwenden Sie den Agent, um die Codebasis zu erkunden, relevante Dateien zu identifizieren und Abhängigkeiten zu verstehen.
Plan: Erstellen Sie einen detaillierten, strukturierten Plan oder eine Spezifikation, bevor Sie Änderungen vornehmen. Hier sind Reasoning-Modelle am wertvollsten.
Implementieren: Den Plan mit fokussiertem Kontext und einem für die Umsetzung geeigneten Modell ausführen.

Das Starten einer neuen Sitzung zwischen den Phasen verhindert, dass unnötiger Kontext mitgeschleppt wird. Eine einzelne Sitzung, die in einem angemessenen Rahmen abgeschlossen wird, profitiert von der Zwischenspeicherung. Die Weiterführung des Kontexts aus früheren Phasen kann die Tokennutzung erhöhen, Verzerrungen einführen und Klarheit für den Agent reduzieren. Jede Phase sollte nur mit dem funktionieren, was sie benötigt. Anleitung zur effektiven Durchführung von Scoping-Sitzungen finden Sie unter Bewährte Methoden für die Verwendung von GitHub Copilot für die Arbeit an Vorgängen.

4. Deterministische Leitplanken hinzufügen

Agents sind nicht deterministisch und werden nicht jedes Mal korrekt sein, insbesondere in mehrstufigen Workflows. Ohne Leitplanken können sich kleine Fehler schnell summieren: Agenten bauen auf fehlerhaften Ergebnissen auf, driften weiter vom Ziel ab und machen das Debuggen teurer und zeitaufwendiger.

Deterministische Steuerelemente führen klare Pass-/Fail-Signale ein:

Unit-Tests überprüfen, ob die Änderungen des Agenten das erwartete Verhalten bewirkt haben.
Linters erzwingen Struktur und Konsistenz, verhindern Formatierungsprobleme, Formatabweichungen und vermeidbare Bereinigungsarbeiten.
Sicherheitsscans erkennen riskante Muster frühzeitig, bevor sie sich nur noch schwer rückgängig machen lassen.

Zusammen bilden diese Kontrollmechanismen eine enge Rückkopplungsschleife: Der Agent nimmt eine Änderung vor, ein Test, eine Regel oder ein Scan bewertet sie, und der Agent passt sein Vorgehen an, bevor er fortfährt. Dies verhindert lange Ketten falscher Änderungen, die einer der größten Treiber von Tokenverschwendung sind.

Teams, die in diese Guardrails investieren, sehen weniger Wiederholungen, schnellere Aufgabenerledigung und vorhersagbares Agentverhalten. Sie reduzieren häufig den Gesamtverbrauch von Token, auch wenn einzelne Schritte im Voraus etwas mehr Token verwenden.

5. Achten Sie auf eine prägnante `copilot-instructions.md`

Dauerhafte Anweisungen verbessern die Konsistenz zwischen Agentinteraktionen, aber ihr Wert hängt vollständig davon ab, wie sie geschrieben werden. Eine copilot-instructions.md Datei auf Repositoryebene ist die direkteste Methode zum Codieren dieser Anleitung. Persönliche Anweisungen und Anweisungen auf Organisationsebene können zusätzlich angewendet werden, um eine übergreifende Konsistenz zu gewährleisten.

Die besten Anweisungen sind kurz, spezifisch und in echtem Verhalten des Agenten verankert – nicht generische bewährte Methoden, die gut klingen, aber nicht auf Ihr System angewendet werden.

Was sie enthalten soll:

Erforderliche Frameworks, Bibliotheken oder Entwurfsmuster
Bekannte Fallstricke, die der Agent häufig wiederholt
Erwartungen an die Ausgabe wie „fassen Sie sich kurz“ oder „nur Code ausgeben“
Teamspezifische Konventionen, die der Agent befolgen muss
Erstellen, Testen und Lintbefehle

Was zu vermeiden ist:

Lange, generische Dokumentation
KI-generierte Anleitungen, die Ihr tatsächliches System nicht widerspiegeln
Einmalige Einstellungen oder selten verwendete Details
Überladene Anweisungen, die den Kontext laut machen

Halten Sie Anweisungen auf dem neuesten Stand, während Ihre Codebasis, Architektur, Standards und Workflows weiterentwickelt werden. Da diese Anweisungen bei jeder Ausführung im Kontext des Agenten enthalten sind, können selbst kleine Verbesserungen wiederkehrende Fehler verringern und den unnötigen Tokenverbrauch im Laufe der Zeit senken.

Weitere Informationen findest du unter Hinzufügen von benutzerdefinierten Repositoryanweisungen für GitHub Copilot.