דילוג לתוכן
חזרה לפרויקטים

ניקוד אמינות עיתונאית

פייפליין שעוקב ומנקד אמינות עיתונאית, מריץ מחסנית LLM מבוססת LangGraph עם הערכה רב-שכבתית — LLM מדומים ל-CI מהיר, מודלי ענן אמיתיים במחזור לילי.

PythonFastAPIAnthropic (Claude)OpenAILangGraphNext.jsPlaywright

בעיה

אמינות עיתונאים מונחת ולא נמדדת — אין דרך שיטתית וחוזרת לעקוב ולנקד דיוק לאורך זמן.

פתרון

מנקדים אמינות עם פייפליין הערכה דו-שכבתי — LLM מדומים למהירות CI ומודלי ענן אמיתיים מדי לילה לנאמנות התנהגותית — ועוקבים אחר הניקוד של כל מקור לאורך זמן.

תוצאות

  • ניקוד אמינות מבוסס LLM בענן
  • הערכה דו-שכבתית (CI מדומה + לילי אמיתי)
  • מעקב אמינות לאורך זמן

פייפליין הערכת LLM שמודד אמינות עיתונאים במקום להניח אותה. אסטרטגיית בדיקות דו-שכבתית שומרת על CI מהיר עם מודלים מדומים, ומאמתת התנהגות אמיתית מדי לילה מול מודלי ענן (Anthropic ו-OpenAI), כאשר LangGraph ונקודות-בדיקה ב-Postgres מתזמרים את ריצות הניקוד.

רוצים משהו כזה?

שיחת היכרות חינם של 15 דקות. בלי מצגות ובלי לחץ — רק לבדוק אם אני יכול לעזור.

המועד הפנוי הבא: June 2026

עבודות נבחרות