이 디렉토리는 K-NeuroMind 프로젝트의 자동화 스크립트를 포함합니다.
목적: 교수진 논문 자동 수집
사용법:
python3 scripts/collect_papers.py기능:
- Google Scholar에서 교수진 논문 수집
- PubMed에서 논문 검색
- CSV 형식으로 메타데이터 저장
출력:
data/metadata/faculty_papers_YYYYMMDD.csv
목적: 문서를 검색 가능한 형태로 인덱싱
사용법:
# 기본 인덱싱
python3 scripts/kb_ingest.py
# OCR 활성화 (이미지 기반 PDF)
python3 scripts/kb_ingest.py --ocr --ocr-lang eng기능:
docs/디렉토리의 Markdown, PDF 파일 인덱싱- SQLite FTS(Full-Text Search) 인덱스 생성
- OCR 지원 (이미지 기반 PDF)
출력:
knowledge_base/kb.sqlite(git에 커밋하지 않음)
인덱싱 대상:
docs/00_task_description/parsed/docs/02_literature/docs/03_proposal/references/
자세한 내용: knowledge_base/README.md
목적: 인덱싱된 문서 검색
사용법:
python3 scripts/kb_query.py "your query"예시:
# 일반 검색
python3 scripts/kb_query.py "brain foundation model"
# 복합 검색
python3 scripts/kb_query.py "cognitive function decoding multimodal"출력:
- 검색 결과 (제목, 내용, 경로)
- 관련도 점수
목적: NotebookLM 노트북 자동 캡처
사용법:
python3 scripts/notebooklm_capture.py전제조건:
- Python 3.8+
- Playwright 설치
설치:
pip install -r requirements.txt
playwright install chromium기능:
- NotebookLM 노트북 자동 캡처
- HTML, PNG, TXT 형식으로 저장
출력:
docs/03_proposal/references/notebooklm/
참고:
- 초기 실행 시 브라우저가 열려 Google 계정 로그인 필요
- 로그인 상태는
scripts/chrome_user_data에 저장
목적: 제안서 섹션 자동 생성
사용법:
python3 scripts/generate_proposal_content.py기능:
- 핵심 메시지 기반 제안서 섹션 생성
- RFP 요구사항 반영
- 평가 기준 대응
목적: RAG(Retrieval-Augmented Generation) 시스템 구축
사용법:
python3 scripts/build_rag.py기능:
- 벡터 데이터베이스 구축
- 임베딩 생성
- 검색 시스템 구축
- Python 3.10+ 권장
pip install -r requirements.txtplaywright install chromium# 1. 논문 수집
python3 scripts/collect_papers.py
# 2. 지식베이스 인덱싱
python3 scripts/kb_ingest.py
# 3. 검색
python3 scripts/kb_query.py "foundation model"# 1. 핵심 메시지 확인
cat docs/03_proposal/core_messages.md
# 2. 제안서 내용 생성
python3 scripts/generate_proposal_content.py
# 3. 관련 문서 검색
python3 scripts/kb_query.py "evaluation criteria"- 메인 README - 프로젝트 개요
- 온보딩 가이드 - 새 참여자 가이드
- 지식베이스 README - 지식베이스 사용법
# OCR 언어 확인
tesseract --list-langs
# 한글 OCR (kor 언어 데이터 필요)
python3 scripts/kb_ingest.py --ocr --ocr-lang kor+eng# Chromium 재설치
playwright install chromium --force각 스크립트의 상세한 사용법은 스크립트 내부의 docstring을 참고하세요.