ํ์ ๊ฐ๋ ๋
ผ๋ฌธ์ ์ฐพ์๋ณด๋ฉฐ ์ฝ์ด๋ณด๋ ํธ์ธ๋ฐ,
ํฅ๋ฏธ๋ก์ด ์ฃผ์ ์์๋ ๋ถ๊ตฌํ๊ณ ๋ด์ฉ์ด ์ง๋์น๊ฒ ์ด๋ ต๊ณ ์ง์
์ฅ๋ฒฝ์ด ๋๋ค๋ ๋ฌธ์ ๋ฅผ ๋๊ผ๋ค.
- ์ ๋ฌธ ์ฉ์ด๊ฐ ๋ง๊ณ
- ๋ฌธ์ฅ์ด ๊ธธ๋ฉฐ
- ํต์ฌ ๋ด์ฉ์ด ์ด๋์ ์๋์ง ํ์ ํ๊ธฐ ์ด๋ ค์
์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด
๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ์ง๋ฌธํ๋ฉด ์ฝ๊ฒ ์ค๋ช
ํด์ฃผ๋ ์์คํ
์ ๋ง๋ค๊ณ ์ ๋ณธ ์ฃผ์ ๋ฅผ ์ ์ ํ์๋ค.
๋
ผ๋ฌธ PDF๋ฅผ ๊ทธ๋๋ก ์ฌ์ฉํ์ง ์๊ณ ,
RAG ์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๊ฑฐ์น๋ค.
- ๋ถํ์ํ ์ค๋ฐ๊ฟ ์ ๊ฑฐ
- ์ฐ์๋ ๊ณต๋ฐฑ ์ ๋ฆฌ
- ๋ฌธ์ฅ ํ๋ฆ์ด ๋๊ธฐ์ง ์๋๋ก ์ ๊ทํ
- ๋ ผ๋ฌธ ๊ตฌ์กฐ๋ฅผ ์ต๋ํ ์ ์งํ๊ธฐ ์ํด ๋ฌธ๋จ ๋จ์๋ก ๋ถ๋ฆฌ
- ์๋ฏธ ๋จ์๊ฐ ์ ์ง๋๋๋ก ์ฒ๋ฆฌ
- ๋ฌธ๋จ ๊ธฐ๋ฐ + ํ ํฐ ์ ํ ๋ฐฉ์
- ํ์ฌ ๋ฌธ๋จ๊ณผ ๋ค์ ๋ฌธ๋จ์ ํฉ์ณค์ ๋
ํ ํฐ ์๊ฐ ์ ํ์ ์ด๊ณผํ๋ฉด ์๋ก์ด ์ฒญํฌ ์์ฑ - ๋ฌธ๋งฅ ์์ค์ ์ค์ด๊ธฐ ์ํด overlap ์ ์ฉ
์ด๋ฅผ ํตํด ๊ฒ์ ์ ํ๋์ ๋ฌธ๋งฅ ์ดํด๋๋ฅผ ๋์์ ํฅ์์์ผฐ๋ค.
- ์ฌ์ฉ์๊ฐ ์ง๋ฌธ์ ์ ๋ ฅํ๋ฉด
- ์ ๋ก๋๋ ๋ ผ๋ฌธ ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ๊ด๋ จ ๋ฌธ์๋ฅผ ๊ฒ์
- ๊ฒ์๋ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ๋ต๋ณ ์์ฑ
- ๋ ผ๋ฌธ์ ๋ฑ์ฅํ๋ ๋จ์ด๋ ๊ฐ๋ ์ ์ง๋ฌธํ ๊ฒฝ์ฐ
- ์ผ๋ฐ์ ์ธ ์ ์๊ฐ ์๋๋ผ
- ํด๋น ๋ ผ๋ฌธ์์ ์ฌ์ฉ๋ ๋งฅ๋ฝ์ ๊ธฐ์ค์ผ๋ก ์ค๋ช
๋ ผ๋ฌธ ์ดํด์ ์ง์ ์ ์ผ๋ก ๋์์ด ๋๋ ๋ต๋ณ ์ ๊ณต
- ์ด๋ ค์ด ๋ ผ๋ฌธ์ ๋ ์ฝ๊ฒ ์ดํดํ๊ธฐ ์ํ ์์คํ
- ๋ฌธ๋จ ๊ธฐ๋ฐ ์ ์ฒ๋ฆฌ์ ์ฒญํฌ ์ค๊ณ๋ก RAG ์ฑ๋ฅ ํฅ์
- ๋ ผ๋ฌธ ์ค์ฌ ์ง๋ฌธยท๋ต๋ณ์ผ๋ก ํ์ต ํจ์จ ๊ฐ์