Skip to content

Latest commit

 

History

History
214 lines (153 loc) · 4.05 KB

File metadata and controls

214 lines (153 loc) · 4.05 KB

스크립트 디렉토리

이 디렉토리는 K-NeuroMind 프로젝트의 자동화 스크립트를 포함합니다.


📋 주요 스크립트

1. 논문 수집 (collect_papers.py)

목적: 교수진 논문 자동 수집

사용법:

python3 scripts/collect_papers.py

기능:

  • Google Scholar에서 교수진 논문 수집
  • PubMed에서 논문 검색
  • CSV 형식으로 메타데이터 저장

출력:

  • data/metadata/faculty_papers_YYYYMMDD.csv

2. 지식베이스 인덱싱 (kb_ingest.py)

목적: 문서를 검색 가능한 형태로 인덱싱

사용법:

# 기본 인덱싱
python3 scripts/kb_ingest.py

# OCR 활성화 (이미지 기반 PDF)
python3 scripts/kb_ingest.py --ocr --ocr-lang eng

기능:

  • docs/ 디렉토리의 Markdown, PDF 파일 인덱싱
  • SQLite FTS(Full-Text Search) 인덱스 생성
  • OCR 지원 (이미지 기반 PDF)

출력:

  • knowledge_base/kb.sqlite (git에 커밋하지 않음)

인덱싱 대상:

  • docs/00_task_description/parsed/
  • docs/02_literature/
  • docs/03_proposal/references/

자세한 내용: knowledge_base/README.md


3. 지식베이스 검색 (kb_query.py)

목적: 인덱싱된 문서 검색

사용법:

python3 scripts/kb_query.py "your query"

예시:

# 일반 검색
python3 scripts/kb_query.py "brain foundation model"

# 복합 검색
python3 scripts/kb_query.py "cognitive function decoding multimodal"

출력:

  • 검색 결과 (제목, 내용, 경로)
  • 관련도 점수

4. NotebookLM 캡처 (notebooklm_capture.py)

목적: NotebookLM 노트북 자동 캡처

사용법:

python3 scripts/notebooklm_capture.py

전제조건:

  • Python 3.8+
  • Playwright 설치

설치:

pip install -r requirements.txt
playwright install chromium

기능:

  • NotebookLM 노트북 자동 캡처
  • HTML, PNG, TXT 형식으로 저장

출력:

  • docs/03_proposal/references/notebooklm/

참고:

  • 초기 실행 시 브라우저가 열려 Google 계정 로그인 필요
  • 로그인 상태는 scripts/chrome_user_data에 저장

5. 제안서 내용 생성 (generate_proposal_content.py)

목적: 제안서 섹션 자동 생성

사용법:

python3 scripts/generate_proposal_content.py

기능:

  • 핵심 메시지 기반 제안서 섹션 생성
  • RFP 요구사항 반영
  • 평가 기준 대응

6. RAG 시스템 구축 (build_rag.py)

목적: RAG(Retrieval-Augmented Generation) 시스템 구축

사용법:

python3 scripts/build_rag.py

기능:

  • 벡터 데이터베이스 구축
  • 임베딩 생성
  • 검색 시스템 구축

🔧 환경 설정

Python 버전

  • Python 3.10+ 권장

의존성 설치

pip install -r requirements.txt

Playwright 설치 (notebooklm_capture.py 사용 시)

playwright install chromium

📝 사용 예시

1. 논문 수집 및 분석

# 1. 논문 수집
python3 scripts/collect_papers.py

# 2. 지식베이스 인덱싱
python3 scripts/kb_ingest.py

# 3. 검색
python3 scripts/kb_query.py "foundation model"

2. 제안서 작성 지원

# 1. 핵심 메시지 확인
cat docs/03_proposal/core_messages.md

# 2. 제안서 내용 생성
python3 scripts/generate_proposal_content.py

# 3. 관련 문서 검색
python3 scripts/kb_query.py "evaluation criteria"

🔗 관련 문서


❓ 문제 해결

OCR 오류

# OCR 언어 확인
tesseract --list-langs

# 한글 OCR (kor 언어 데이터 필요)
python3 scripts/kb_ingest.py --ocr --ocr-lang kor+eng

Playwright 오류

# Chromium 재설치
playwright install chromium --force

📚 추가 정보

각 스크립트의 상세한 사용법은 스크립트 내부의 docstring을 참고하세요.