feat(retrieval): 답변 프롬프트 위생 v2 — faithfulness/conciseness 누수 차단 by TaskerJang · Pull Request #68 · TaskerJang/doc-graph-agent

TaskerJang · 2026-05-30T10:23:49Z

배경 — 측정이 짚어준 1순위 레버

gpt52_p1clean 80-QA 측정에서 가장 비용 대비 효과 큰 병목으로 답변 생성 프롬프트의 기계어 누수가 나왔다.

Faithfulness 17~20%인데, 대부분 "답이 틀려서"가 아니다. AC 4~5점(정답)인데 Not Faithful로 깎인 케이스가 ~13건. 사유는 전부 그래프 / HAS_METRIC / RECOMMENDED_FOR / 두산밥캣(247560) / Layer B / subgraph / 청크 c0001 / (p.정보 없음) 같은 내부 시스템 용어가 답변 본문에 새어 원문에 없는 내용으로 판정됐기 때문.
Conciseness 1.5/5 — 서사형 장황함 + 질문 되풀이.
over-refusal — 원문(sample_chunks.text)에 답이 있는데도 "직접 연결된 관계가 없어 알 수 없다"고 거부 (예: graph_003 총고객자산 405/453/477이 청크에 있는데 거부).

retrieval을 한 글자도 안 건드리고 답변 프롬프트만 고쳐도 faithfulness·conciseness가 오를 수 있는 영역이라 먼저 착수.

v1 진단

두 답변 프롬프트(local_retriever_answer_v1.md, text2cypher_answer_v1.md) 공통:

페르소나가 "그래프 DB/subgraph 결과 전달자" → 답이 그래프 중심으로 서술됨.
few-shot 예시들이 FACES_RISK 관계 / Company 라벨 상위 5개 / 19 청크 언급 / entity 추출 라벨 품질 보강 같은 기계어를 모범답안으로 학습시킴.
local v1은 layer_b_relations를 "가장 신뢰도 높음", sample_chunks를 "약한 보완"으로 못 박음 → GPT-5.2의 conservative grounding bias와 맞물려 관계가 없으면 답을 거부.

변경 내용

신규 v2 프롬프트 2개 + 로더 상수 2개 전환 (v1.md는 롤백용 보존, 코드 로직 변경 없음):

파일	변경
`retrieval/prompts/local_retriever_answer_v2.md`	신규
`retrieval/prompts/text2cypher_answer_v2.md`	신규
`retrieval/local_retriever.py`	`ANSWER_PROMPT_PATH` → v2 (1줄)
`retrieval/text2cypher.py`	`ANSWER_PROMPT_PATH` → v2 (1줄)

v2 공통 설계

페르소나 전환: 그래프 결과 전달자 → 자료 근거로 답하는 금융 분석가.
진실 소스 역전: sample_chunks.text(원문)·result(조회값) = 1차 답변 근거 / 관계·라벨·co-mention·chunk_id·group_size = 내부 힌트(답변 노출 금지).
over-refusal 차단: 명시적 관계가 없어도 원문에 답이 있으면 단정해서 답함.
기계어 금지어 리스트 + 원문에 없는 종목코드(예: (247560)) 금지.
padding 금지(묻지 않은 인접 수치 첨가 금지) · 깔끔한 N/A("제공된 자료에서는 …를 찾을 수 없습니다", 기계어 0 → negative AC 5.0 보존) · 길이 2~4문장 · 출력 전 self-check.
few-shot 예시 전면 재작성(누수 예시 제거, anti-refusal·clean N/A 시연).

text2cypher v2 — 조건부 예외

질문 자체가 분류/라벨링/문서구성을 묻는 메타 질문(예: graph_040 "회사로 분류된 게 실제 회사명인가", doc_type 집계)일 때만 '회사로 분류' 같은 분류 표현을 허용(내부 라벨명·실행 디테일은 비노출). 이 영역(filter_agg·limitation)이 GraphRAG가 BM25를 이기는 구간이라 정확도 보존을 위해 무조건 금지하지 않음.

레퍼런스

GPT-5.2 Prompting Guide (Dec 2025): conservative grounding bias 상쇄, output_verbosity_spec(§3.1), scope drift 금지(§3.2), high_risk_self_check(§3.4) 차용.
Microsoft GraphRAG local search: "근거 없는 정보 금지 / 모르면 모른다 / 데이터를 1차 컨텍스트로" 규율 차용 ([Data:] 인용 태그는 의도적으로 폐기 — 그게 우리가 빼는 누수).
LangChain GraphCypherQAChain CYPHER_QA_TEMPLATE: "result는 권위 근거, 의심·보정 금지, 답처럼 말하되 근거 언급 금지, 빈 결과→모름" 골든룰 이식.

검증 계획

동일 #61 커맨드로 재측정 후 gpt52_p1clean과 비교:

uv run python -m scripts.run_qa_eval --qa-set both --tag gpt52_p1clean_answerv2 \
  --llm-model openai/gpt-5.2 --llm-base-url https://openrouter.ai/api/v1 --llm-api-key-env OPENROUTER_API_KEY \
  --judge-model anthropic/claude-haiku-4.5 --judge-base-url https://openrouter.ai/api/v1 --judge-api-key-env OPENROUTER_API_KEY

기대: Faithfulness↑(기계어 누수 제거) · Conciseness↑ · AC 소폭↑(over-refusal 감소). → 블로그 3편 소재.

롤백

두 로더의 ANSWER_PROMPT_PATH를 _v1.md로 되돌리면 즉시 원복.

base가 feat/p1-extractor-hardening인 이유: 측정·클린그래프·#66/#67 수정이 그 브랜치에 있고 dev엔 아직 없음.

…nti-leak) v1 진단: 페르소나가 'subgraph 결과 전달자'라 답변에 그래프/관계타입/라벨/청크ID 같은 내부 용어가 새어 faithfulness가 깎이고(80-QA AC≥4인데 Not Faithful 다수), '명시적 관계 최우선·청크는 약한 보완' 지침이 GPT-5.2의 conservative grounding bias와 맞물려 원문에 답이 있어도 거부하게 만듦(over-refusal). v2 변경: - 페르소나: 그래프 결과 전달자 → 자료 근거로 답하는 금융 분석가 - 진실 소스 역전: sample_chunks.text = 1차 답변 근거, 관계/라벨/co-mention/chunk_id = 내부 힌트(노출 금지) - over-refusal 차단: 명시적 관계가 없어도 원문에 답이 있으면 단정해서 답함 - 기계어 금지어 리스트 + 원문에 없는 종목코드 금지 - padding 금지(GPT-5.2 §3.2), 깔끔한 N/A(negative AC 5.0 보존), 길이 2~4문장(§3.1) - 출력 전 self-check(§3.4 high_risk_self_check) + few-shot 전면 재작성(누수 예시 제거) ref: GPT-5.2 Prompting Guide, MS GraphRAG local search grounding rules

…leak) v1 진단: 페르소나가 '조회 결과 전달자'라 답변에 Cypher/그래프/라벨/group_size 같은 내부 용어가 새어 faithfulness가 깎임. 예시들이 "Company 라벨 상위 5개", "19 청크 언급", "entity 추출 라벨 품질 보강" 식 기계어를 모범답안으로 학습시킴. v2 변경: - 페르소나: 결과 전달자 → 자료 근거로 답하는 금융 분석가 - LangChain Cypher-QA 골든룰 이식: result는 권위 근거, 의심·보정 금지, 질문에 대한 답처럼 말하되 "결과/쿼리에 근거했다는 사실은 언급하지 말 것", 빈 결과→모름 - 기계어 금지(도메인 질문) + padding 금지 + 깔끔한 N/A + 길이 2~4문장 - 조건부 예외: 질문 자체가 분류/라벨링/문서구성을 묻는 메타 질문일 때만 '회사로 분류' 같은 분류 표현 허용(단 내부 라벨명·실행 디테일은 비노출). → filter_agg·limitation 류(GraphRAG가 BM25 이기는 영역) 정확도 보존 - 출력 전 self-check + few-shot 전면 재작성 ref: GPT-5.2 Prompting Guide, LangChain GraphCypherQAChain CYPHER_QA_TEMPLATE

ANSWER_PROMPT_PATH 만 local_retriever_answer_v2.md 로 변경 (위생 프롬프트 활성화). v1.md 는 롤백용으로 보존. 코드 로직 변경 없음.

ANSWER_PROMPT_PATH 만 text2cypher_answer_v2.md 로 변경 (위생 프롬프트 활성화). v1.md 는 롤백용으로 보존. 코드 로직 변경 없음.

TaskerJang added 4 commits May 30, 2026 19:18

feat(retrieval): local_retriever 답변 프롬프트 v1 → v2 전환

55d195c

ANSWER_PROMPT_PATH 만 local_retriever_answer_v2.md 로 변경 (위생 프롬프트 활성화). v1.md 는 롤백용으로 보존. 코드 로직 변경 없음.

feat(retrieval): text2cypher 답변 프롬프트 v1 → v2 전환

3ee786f

ANSWER_PROMPT_PATH 만 text2cypher_answer_v2.md 로 변경 (위생 프롬프트 활성화). v1.md 는 롤백용으로 보존. 코드 로직 변경 없음.

TaskerJang merged commit 0fbc3b6 into feat/p1-extractor-hardening May 30, 2026

TaskerJang deleted the feat/p3-answer-prompt-hygiene branch May 30, 2026 11:03

This was referenced May 30, 2026

Revert "feat(retrieval): 답변 프롬프트 위생 v2 — faithfulness/conciseness 누수 차단" #69

Merged

feat(retrieval): BM25 어휘 검색 갈래 추가 — factual AC +0.98 (두 네거티브가 가리킨 처방) #71

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat(retrieval): 답변 프롬프트 위생 v2 — faithfulness/conciseness 누수 차단#68

feat(retrieval): 답변 프롬프트 위생 v2 — faithfulness/conciseness 누수 차단#68
TaskerJang merged 4 commits into
feat/p1-extractor-hardeningfrom
feat/p3-answer-prompt-hygiene

TaskerJang commented May 30, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

TaskerJang commented May 30, 2026

배경 — 측정이 짚어준 1순위 레버

v1 진단

변경 내용

v2 공통 설계

text2cypher v2 — 조건부 예외

레퍼런스

검증 계획

롤백

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant