Skip to content
IT/AI

AI ์„ค์น˜ ํ•˜๊ธฐ: ์ปดํ“จํ„ฐ์— AI ์„ค์น˜ ๋ฐฉ๋ฒ•๋ถ€ํ„ฐ ํ…Œ์ŠคํŠธ๋ฐ ์‚ฌ์šฉ๊นŒ์ง€

AI ์„ค์น˜ํ•˜๊ณ  ๊ฐœ์ธ ์ปดํ“จํ„ฐ์— ํ™œ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•

์ธ๊ณต์ง€๋Šฅ(AI) ๋ชจ๋ธ์„ ๊ฐœ์ธ ์ปดํ“จํ„ฐ๋‚˜ ๋กœ์ปฌ ํ™˜๊ฒฝ์— ์„ค์น˜ํ•˜๋Š” ์ค€๋น„ ๋ฐฉ๋ฒ•๊ณผ ์„ค์น˜ ์ „ ๊ธฐ๋ณธ ๊ตฌ์„ฑ ์š”์†Œ ์ ๊ฒ€๋ถ€ํ„ฐ ์‹ค์ œ ํ™œ์šฉ๊นŒ์ง€ ์‹ค์ „ ๋ฐฉ๋ฒ•์„ ์‚ดํŽด๋ด…๋‹ˆ๋‹ค.๋ชฉํ‘œ๋Š” ํ•„์š”ํ•œ ์ปดํ“จํ„ฐ AI ์„ค์น˜ ๋ฐฉ๋ฒ•์˜ ์ „์ฒด ๊ณผ์ •์„ ๋ช…ํ™•ํ•˜๊ฒŒ ํŒŒ์•…ํ•˜๊ณ , ์„ฑ๊ณต์ ์ธ ๋กœ์ปฌ AI ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.


1. AI ์„ค์น˜ ์ „ ๊ธฐ๋ณธ ํ™˜๊ฒฝ ๊ตฌ์„ฑ๊ณผ ํ•„์ˆ˜ ์กฐ๊ฑด ์ ๊ฒ€

์ฒ˜์Œ AI ๋ชจ๋ธ ์„ค์น˜๋ฅผ ์‹œ๋„ํ•˜๋Š” ๋ถ„๋“ค์€ ๋ฌด์—‡์„ ์ค€๋น„ํ•ด์•ผ ํ• ์ง€ ๋ง‰๋ง‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ์ปฌ AI ์„ค์น˜์˜ ํ•ต์‹ฌ์€ ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ •ํ™•ํžˆ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋ถ€๋ถ„์ด ๊ณง ์„ค์น˜ ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

1.1. AI ์„ค์น˜์˜ ๊ธฐ๋ณธ ์กฐ๊ฑด: GPU์™€ VRAM์˜ ์ค‘์š”์„ฑ

AI ๋ชจ๋ธ, ํŠนํžˆ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ๊ฐœ์ธ ์ปดํ“จํ„ฐ์—์„œ ๊ตฌ๋™ํ•˜๋ ค๋ฉด ๊ทธ๋ž˜ํ”ฝ ์ฒ˜๋ฆฌ ์žฅ์น˜(GPU)์™€ ๊ทธ ๋ฉ”๋ชจ๋ฆฌ์ธ VRAM(Video RAM) ํ™•๋ณด๊ฐ€ ๊ฐ€์žฅ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

  • VRAM ์šฉ๋Ÿ‰์˜ ๊ธฐ์ค€: ์ดˆ๋ณด์ž๊ฐ€ ๊ฐ€์žฅ ํ”ํžˆ ๋†“์น˜๋Š” ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 7B ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ์˜ ๋ชจ๋ธ์„ ์›ํ™œํ•˜๊ฒŒ ์‹คํ–‰ํ•˜๋ ค๋ฉด ์ตœ์†Œ 4GB ์ด์ƒ์˜ VRAM์ด ํ•„์š”ํ•˜๋ฉฐ, ๋” ํฐ 13B ๋ชจ๋ธ์€ 8GB ์ด์ƒ์˜ VRAM์ด ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ธฐ์ค€์€ ๋‹จ์ˆœํ•œ ์ถ”์ฒœ์ด ์•„๋‹ˆ๋ผ, ๋ชจ๋ธ ๋กœ๋”ฉ๊ณผ ์—ฐ์‚ฐ์ด ์‹ค์ œ๋กœ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ํ•„์ˆ˜ ์กฐ๊ฑด์ž…๋‹ˆ๋‹ค.
  • ์‚ฌ์ „ ์ ๊ฒ€: ๋”ฐ๋ผ์„œ AI ์„ค์น˜๋ฅผ ์‹œ๋„ํ•˜๊ธฐ ์ „์— ๋ฐ˜๋“œ์‹œ ์ž์‹ ์˜ ๊ทธ๋ž˜ํ”ฝ ์นด๋“œ ๋ชจ๋ธ๋ช…๊ณผ VRAM ์šฉ๋Ÿ‰์„ ๋จผ์ € ํ™•์ธํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

1.2. ์„ค์น˜ ๋ฐฉ์‹ ์„ ํƒ: ๋กœ์ปฌ๊ณผ ํด๋ผ์šฐ๋“œ ๋ฐฉ์‹์˜ ๋น„๊ต

๊ฐœ์ธ ์ปดํ“จํ„ฐ AI ์„ค์น˜๋Š” ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ž์‹ ์˜ ๋ชฉ์ ๊ณผ ํ™˜๊ฒฝ์— ๋งž์ถฐ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

๊ตฌ๋ถ„ ์„ค๋ช… ๋กœ์ปฌ AI ์„ค์น˜ ์‹œ ์ฃผ์˜์‚ฌํ•ญ
๋กœ์ปฌ ์„ค์น˜ ๊ฐœ์ธ PC ํ•˜๋“œ์›จ์–ด ์„ฑ๋Šฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ง์ ‘ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๋Š” ๋ฐฉ์‹. VRAM ์šฉ๋Ÿ‰๊ณผ ์ €์žฅ ๊ณต๊ฐ„ ํ™•๋ณด๊ฐ€ ํ•„์ˆ˜์ด๋ฉฐ, ์ดˆ๊ธฐ ์„ค์ • ๋‚œ์ด๋„๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ๋†’์Œ.
ํด๋ผ์šฐ๋“œ ์„ค์น˜ ์„œ๋ฒ„ ์ž์›(Google Colab, AWS ๋“ฑ)์„ ํ™œ์šฉํ•˜๋Š” ๋ฐฉ์‹. ์„ฑ๋Šฅ ๊ฑฑ์ •์€ ์—†์œผ๋‚˜ ์ง€์†์ ์ธ ๋น„์šฉ์ด ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ํ•„์ˆ˜.

AI ๋กœ์ปฌ ์„ค์น˜๋Š” ํ•œ ๋ฒˆ ๊ตฌ์ถ•๋˜๋ฉด ์ž์œ ๋„๊ฐ€ ๋†’๊ณ  ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ฌด์—‡๋ณด๋‹ค ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ๋ฅผ ์™„๋ฒฝํ•˜๊ฒŒ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.


2. AI ์„ค์น˜๋ฅผ ์œ„ํ•ด ์ปดํ“จํ„ฐ ์‚ฌ์–‘ ์ ๊ฒ€ ๋ฐ ๊ตฌ์กฐ ์ดํ•ด

์ปดํ“จํ„ฐ์— AI ์„ค์น˜์˜ ์„ฑ๊ณต์€ ์ปดํ“จํ„ฐ ์‚ฌ์–‘ ์ ๊ฒ€์—์„œ ์‹œ์ž‘๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ GPU ์œ ๋ฌด์™€ ์„ฑ๋Šฅ์€ AI ์„ฑ๋Šฅ์˜ 90%๋ฅผ ์ขŒ์šฐํ•˜๋ฏ€๋กœ, ์ด ๋ถ€๋ถ„์„ ์ •ํ™•ํ•˜๊ฒŒ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค.

2.1. AI ์„ฑ๋Šฅ์„ ์œ„ํ•œ GPU ๊ถŒ์žฅ ๊ธฐ์ค€

GPU๋Š” LLM ์ถ”๋ก  ์‹œ ๋ณ‘๋ ฌ ์—ฐ์‚ฐ์˜ ๋Œ€๋ถ€๋ถ„์„ ๋‹ด๋‹นํ•ฉ๋‹ˆ๋‹ค. GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋” ํฐ ๋ชจ๋ธ ๊ตฌ๋™๊ณผ ๋น ๋ฅธ ์‘๋‹ต ์†๋„๋ฅผ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

๊ตฌ๋ถ„ ์ตœ์†Œ ์‚ฌ์–‘ ๊ถŒ์žฅ ์‚ฌ์–‘ AI ์„ค์น˜ ๊ด€์  ์„ค๋ช…
GPU GTX 1650 ์ด์ƒ RTX 3060 (12GB) ์ด์ƒ AI ๋ชจ๋ธ ์—ฐ์‚ฐ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.
VRAM 4GB 8GB ~ 12GB VRAM ์šฉ๋Ÿ‰์ด ๊ณง ๊ตฌ๋™ ๊ฐ€๋Šฅํ•œ ์ตœ๋Œ€ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
RAM 8GB 16GB ~ 32GB ๋ชจ๋ธ ๋กœ๋”ฉ ์˜ค๋ฅ˜ ๋ฐฉ์ง€ ๋ฐ ์›ํ™œํ•œ ์‹œ์Šคํ…œ ์šด์˜์— ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
์ €์žฅ๊ณต๊ฐ„ 20GB 50GB ์ด์ƒ GGUF ํŒŒ์ผ๊ณผ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ์ €์žฅํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

2.2. GPU๊ฐ€ ์—†๋Š” PC์—์„œ์˜ AI ์„ค์น˜ ๋ฐฉ๋ฒ•

์ผ๋ฐ˜ ์‚ฌ์šฉ์ž๋“ค์€ "GPU ์—†์ด๋„ AI ๋ชจ๋ธ ์„ค์น˜๊ฐ€ ๊ฐ€๋Šฅํ•œ๊ฐ€?"๋ผ๋Š” ์งˆ๋ฌธ์„ ๋งŽ์ด ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋‹จ, ์ž‘๊ณ  ๊ฐ€๋ฒผ์šด ๋ชจ๋ธ์— ํ•œํ•ด์„œ๋งŒ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์†๋„๋Š” ์ƒ๋‹นํžˆ ๋А๋ฆฝ๋‹ˆ๋‹ค.

  • GPU ์—†๋Š” PC ์ถ”์ฒœ ๋ชจ๋ธ: Phi-2, Qwen 0.5B ~ 2B, Gemma 2B ๋“ฑ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ ์ค‘์‹ฌ.
  • ๊ฐ€๋Šฅ ์ž‘์—…: ๊ฐ„๋‹จํ•œ ์ฑ„ํŒ…, ์š”์•ฝ, ๋ฒˆ์—ญ, ๊ธ€์“ฐ๊ธฐ ๋“ฑ ์ €์—ฐ์‚ฐ ์ž‘์—….
  • ์–ด๋ ค์šด ์ž‘์—…:์ด๋ฏธ์ง€ ์ƒ์„ฑ AI(Stable Diffusion ๋“ฑ)๋‚˜ Llama 13B ์ด์ƒ์˜ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ๊ตฌ๋™.

2.3. ๋‚ด ์ปดํ“จํ„ฐ ์‚ฌ์–‘ ํ™•์ธํ•˜๋Š” ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•

AI ์„ค์น˜ ์ค€๋น„๋ฅผ ์œ„ํ•ด ์ž์‹ ์˜ ์‚ฌ์–‘์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ํ™•์ธํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

  1. Windows ์ž‘์—… ๊ด€๋ฆฌ์ž ํ™œ์šฉ: Ctrl + Shift + Esc๋ฅผ ๋ˆŒ๋Ÿฌ ์ž‘์—… ๊ด€๋ฆฌ์ž๋ฅผ ์—ด๊ณ  '์„ฑ๋Šฅ' ํƒญ์—์„œ GPU ๋ชจ๋ธ๋ช…๊ณผ VRAM ์šฉ๋Ÿ‰์„ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.
  2. ์ €์žฅ ๊ณต๊ฐ„ ์ฒดํฌ: AI ๋ชจ๋ธ ํŒŒ์ผ์ธ GGUF ๋“ฑ์˜ ํŒŒ์ผ ํฌ๊ธฐ๊ฐ€ ํฌ๋ฏ€๋กœ, SSD/HDD ์šฉ๋Ÿ‰์ด ์ถฉ๋ถ„ํ•œ์ง€ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.

2.4. AI ์„ ํƒํ•˜๊ธฐ ์‰ฌ์šด AI ์„ค์น˜ ๋ฐฉ๋ฒ•

AI ๋ชจ๋ธ ์„ค์น˜ ๋ฐฉ๋ฒ•์€ ๋ณต์žกํ•ด ๋ณด์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ์ดˆ๋ณด์ž์—๊ฒŒ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์›น ์ธํ„ฐํŽ˜์ด์Šค ๊ธฐ๋ฐ˜ ๋ฐฉ์‹์ด ๊ฐ€์žฅ ์ถ”์ฒœ๋ฉ๋‹ˆ๋‹ค.

  • LM Studio / Oobabooga / Ollama: ์ด๋Ÿฌํ•œ ๋„๊ตฌ๋“ค์€ ์„ค์น˜ ๋‚œ์ด๋„๋ฅผ ๋Œ€ํญ ๋‚ฎ์ถ”๊ณ , ์‚ฌ์šฉ์ž๊ฐ€ ํด๋ฆญ ๋ช‡ ๋ฒˆ์œผ๋กœ ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์ฑ„ํŒ… ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด ๋ฐ”๋กœ ํ…Œ์ŠคํŠธํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ์—์„œ ์ค‘์ ์ ์œผ๋กœ ๋‹ค๋ฃฐ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
  • ๊ฐœ๋ฐœ์ž ๋ฒ„์ „ (Python + CUDA):Python ์„ค์น˜, ๊ฐ€์ƒํ™˜๊ฒฝ ์ƒ์„ฑ, CUDA ์„ค์น˜ ๋“ฑ ๋ณต์žกํ•œ ๊ณผ์ •์„ ๊ฑฐ์น˜๋ฉฐ ์ž์œ ๋„๊ฐ€ ๋†’์ง€๋งŒ, ์ดˆ๋ณด์ž์—๊ฒŒ๋Š” ์‹คํŒจ์œจ์ด ๋†’์Šต๋‹ˆ๋‹ค.

3. ์‹ค์ „ AI ์„ค์น˜ ๋‹จ๊ณ„: LM Studio ๊ธฐ๋ฐ˜ (๊ฐ„๋‹จํ•œ ์„ค์น˜ ์ถ”์ฒœ)

๊ฐ€์žฅ ์‰ฝ๊ฒŒ ์ปดํ“จํ„ฐ์— AI ์„ค์น˜๋ฅผ ์™„๋ฃŒํ•  ์ˆ˜ ์žˆ๋Š”LM Studio ๊ธฐ๋ฐ˜์˜ ๋‹จ๊ณ„๋ณ„ ๊ณผ์ •์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค.

3.1. ์„ค์น˜ ์ „ ํ•„์ˆ˜ ํ”„๋กœ๊ทธ๋žจ ๋ฐ ์ค€๋น„ ์‚ฌํ•ญ

AI ๋ชจ๋ธ์„ ๊ตฌ๋™ํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ์ตœ์†Œํ•œ์˜ ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.

  1. NVIDIA ๋“œ๋ผ์ด๋ฒ„ ๋ฐ CUDA ํ™•์ธ: GPU๋ฅผ ์‚ฌ์šฉํ•˜๋ ค๋ฉด ์ตœ์‹  NVIDIA ๋“œ๋ผ์ด๋ฒ„ ์„ค์น˜๊ฐ€ ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด๋Š” CUDA ์—ฐ๋™์„ ์œ„ํ•ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. (CPU๋งŒ ์‚ฌ์šฉ ์‹œ ์ƒ๋žต ๊ฐ€๋Šฅ)
  2. Python ๋ฐ Git (์„ ํƒ):LM Studio ์‚ฌ์šฉ ์‹œ ํ•„์ˆ˜์ ์ด์ง€๋Š” ์•Š์ง€๋งŒ, ์ถ”ํ›„ Web UI๋‚˜ ๊ฐœ๋ฐœ์ž ๋ชจ๋“œ๋ฅผ ์‚ฌ์šฉํ•˜๋ ค๋ฉด Python 3.10 ์ด์ƒ๊ณผ Git ์„ค์น˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

3.2. LM Studio๋ฅผ ์ด์šฉํ•œ ๋ชจ๋ธ ์„ค์น˜

LM Studio๋Š” Hugging Face์˜ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ์‰ฝ๊ฒŒ ํƒ์ƒ‰ํ•˜๊ณ  ๋กœ์ปฌ์— ์„ค์น˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋•๋Š” ์˜ฌ์ธ์› ๋„๊ตฌ์ž…๋‹ˆ๋‹ค.

์ปดํ“จํ„ฐ์— AI ์„ค์น˜ํ•˜๋Š” ๋ฐฉ๋ฒ•
์ปดํ“จํ„ฐ์— AI๋ฅผ ์„ค์น˜ํ•˜๋Š” ๊ฐ€์žฅ ์‰ฌ์šด ๋ฐฉ๋ฒ• LM STUDIO ์‚ฌ์šฉํ•˜๊ธฐ
  1. LM Studio ๋‹ค์šด๋กœ๋“œ ๋ฐ ์‹คํ–‰: ๊ณต์‹ ์›น์‚ฌ์ดํŠธ์—์„œ ์•ฑ์„ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ์„ค์น˜ํ•˜๊ณ  ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.
  2. ๋ชจ๋ธ ๊ฒ€์ƒ‰ ๋ฐ GGUF ํŒŒ์ผ ์„ ํƒ: ์•ฑ ๋‚ด ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์„ ํ†ตํ•ด ์›ํ•˜๋Š” LLM(์˜ˆ: Mistral)์„ ๊ฒ€์ƒ‰ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ ์‹คํ–‰์— ์ตœ์ ํ™”๋œ GGUF ํ™•์žฅ์ž๋ฅผ ๊ฐ€์ง„ ํŒŒ์ผ์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.
    • Tip: ํŒŒ์ผ๋ช…์— ์žˆ๋Š” Q4_K_M ๋“ฑ์€ ์–‘์žํ™” ๋ ˆ๋ฒจ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ˆซ์ž๊ฐ€ ๋‚ฎ์„์ˆ˜๋ก ์šฉ๋Ÿ‰์ด ์ž‘๊ณ  ์†๋„๊ฐ€ ๋น ๋ฅด์ง€๋งŒ, ์„ฑ๋Šฅ ์†์‹ค์ด ์•ฝ๊ฐ„ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. VRAM ์šฉ๋Ÿ‰์— ๋งž์ถฐ ์ ์ ˆํ•œ ์–‘์žํ™” ๋ ˆ๋ฒจ์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.
  3. ๋‹ค์šด๋กœ๋“œ ๋ฐ ๋กœ๋“œ: ์„ ํƒํ•œ ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์šด๋กœ๋“œ ์™„๋ฃŒ ํ›„ '๋ชจ๋ธ ๋กœ๋“œ' ํƒญ์—์„œ ํ•ด๋‹น ๋ชจ๋ธ์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.
  4. GPU ์˜คํ”„๋กœ๋“œ ์„ค์ •:VRAM ์šฉ๋Ÿ‰์— ๋งž๊ฒŒ GPU ์˜คํ”„๋กœ๋“œ(GPU Offload) ๋ ˆ์ด์–ด๋ฅผ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด ์„ค์ •์„ ํ†ตํ•ด GPU๋ฅผ ์ตœ๋Œ€ํ•œ ํ™œ์šฉํ•˜์—ฌ ์—ฐ์‚ฐ ์†๋„๋ฅผ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

3.3. ๋ชจ๋ธ ๋กœ๋“œ ๋ฐ ํ…Œ์ŠคํŠธ (์„ค์น˜ ์„ฑ๊ณต์˜ ํ™•์ธ)

AI ์„ค์น˜ ํ›„ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋‹จ๊ณ„๋Š” ๋ชจ๋ธ์ด ์ •์ƒ์ ์œผ๋กœ ๋กœ๋“œ๋˜๊ณ  ๋ฐ˜์‘ํ•˜๋Š”์ง€ ํ™•์ธํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

  1. ์ฑ„ํŒ… ์ธํ„ฐํŽ˜์ด์Šค ํ™œ์šฉ:'์ฑ„ํŒ… ํƒญ'์œผ๋กœ ์ด๋™ํ•˜์—ฌ ๋กœ๋“œ๋œ ๋ชจ๋ธ์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.
  2. ํ”„๋กฌํ”„ํŠธ ์ž…๋ ฅ: ๊ฐ„๋‹จํ•œ ์งˆ๋ฌธ("์•ˆ๋…•ํ•˜์„ธ์š”, AI์•ผ")์„ ์ž…๋ ฅํ•˜์—ฌ ๋ชจ๋ธ์˜ ์‘๋‹ต ์†๋„์™€ ์ผ๊ด€์„ฑ์„ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.
    • ์ ๊ฒ€ ์‚ฌํ•ญ:GPT-7B ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ ๋ณดํ†ต 1~3์ดˆ ๋‚ด์— ์‘๋‹ต์ด ์™€์•ผ ์ •์ƒ์ ์ธ ๋กœ์ปฌ ๊ตฌ๋™์œผ๋กœ ๊ฐ„์ฃผ๋ฉ๋‹ˆ๋‹ค. ์‘๋‹ต์ด ๋„ˆ๋ฌด ๋А๋ฆฌ๊ฑฐ๋‚˜ ์˜ค๋ฅ˜ ๋ฉ”์‹œ์ง€๊ฐ€ ๋œจ๋ฉด VRAM ๋ถ€์กฑ์ด๋‚˜ GPU ๋“œ๋ผ์ด๋ฒ„ ๋ฌธ์ œ๋ฅผ ์˜์‹ฌํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

4. AI ๋ชจ๋ธ ์ตœ์ ํ™”, ํ™œ์šฉ ์‚ฌ๋ก€ ๋ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ

AI ์„ค์น˜๊ฐ€ ์™„๋ฃŒ๋˜์—ˆ๋‹ค๋ฉด, ์ด์ œ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ™œ์šฉํ•  ์ฐจ๋ก€์ž…๋‹ˆ๋‹ค.

4.1. ํ•˜๋“œ์›จ์–ด ๋ฐ ์†Œํ”„ํŠธ์›จ์–ด ์ตœ์ ํ™” ํŒ

  • ๋ชจ๋ธ ์–‘์žํ™”(Quantization): ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค„์—ฌ RAM/VRAM ๋ถ€๋‹ด์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ์ดˆ๋ณด์ž๋Š” Q4๋‚˜ Q5 ๋ ˆ๋ฒจ์˜ GGUF ํŒŒ์ผ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค.
  • GPU ํ™œ์šฉ ๊ทน๋Œ€ํ™”: LM Studio์˜ GPU ์˜คํ”„๋กœ๋“œ ๊ธฐ๋Šฅ์„ ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ GPU์™€ VRAM์„ ํšจ์œจ์ ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ๊ฐ€์ƒํ™˜๊ฒฝ ๋ถ„๋ฆฌ (Python ์„ค์น˜ ์‹œ): ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ๋‹ค๋ฃฐ ๊ฒฝ์šฐ, Python ๊ฐ€์ƒํ™˜๊ฒฝ์„ ๋งŒ๋“ค์–ด ํŒจํ‚ค์ง€ ๊ฐ„์˜ ์ถฉ๋Œ์„ ๋ฐฉ์ง€ํ•ด์•ผ AI ํ™˜๊ฒฝ์˜ ์•ˆ์ •์„ฑ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

4.2. ๋กœ์ปฌ AI ๋ชจ๋ธ์˜ ์‹ค์ „ ํ™œ์šฉ ์‚ฌ๋ก€

์ปดํ“จํ„ฐ AI ์„ค์น˜์˜ ๊ฐ€์žฅ ํฐ ์ด์ ์€ ์•ˆ์ „ํ•˜๊ณ  ์ž์œ ๋กœ์šด ํ™œ์šฉ์ž…๋‹ˆ๋‹ค.

  1. ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ ์œ ์ง€: ๋ฏผ๊ฐํ•œ ๋ฌธ์„œ ์š”์•ฝ, ๋‚ด๋ถ€ ์ฝ”๋“œ ์ƒ์„ฑ ๋“ฑ ๋ชจ๋“  ์ž‘์—…์ด ๋กœ์ปฌ ํ™˜๊ฒฝ์—์„œ ์ด๋ฃจ์–ด์ง€๋ฏ€๋กœ ์ •๋ณด ์œ ์ถœ ์œ„ํ—˜์ด ์—†์Šต๋‹ˆ๋‹ค.
  2. ์ž‘์—… ์ž๋™ํ™”:OpenAI ํ˜ธํ™˜ API ์„œ๋ฒ„ ๊ธฐ๋Šฅ์„ ํ™œ์„ฑํ™”ํ•˜๋ฉด, ํŒŒ์ด์ฌ์ด๋‚˜ ๋‹ค๋ฅธ ์™ธ๋ถ€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ๋กœ์ปฌ ๋ชจ๋ธ์„ ํ˜ธ์ถœํ•˜์—ฌ ๋ฐ˜๋ณต์ ์ธ ์—…๋ฌด๋‚˜ ๋ฌธ์„œ ์ž๋™ํ™”์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  3. ์ฐฝ์˜์  ์ฝ˜ํ…์ธ  ์ œ์ž‘: LLM์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ด๋ฏธ์ง€ ์ƒ์„ฑ AI์™€ ์—ฐ๋™ํ•˜์—ฌ ํ…์ŠคํŠธ-์ด๋ฏธ์ง€ ์ฝ˜ํ…์ธ  ์ œ์ž‘์—๋„ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

4.3. ์ดˆ๋ณด์ž๊ฐ€ ํ”ํžˆ ๊ฒช๋Š” ๋ฌธ์ œ์™€ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ• (FAQ)

๋ฌธ์ œ ์œ ํ˜• ์›์ธ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•
๋ชจ๋ธ ๋กœ๋“œ ์‹คํŒจ VRAM ๋ถ€์กฑ, ๊ฒฝ๋กœ ๊ณต๋ฐฑ, ๊ถŒํ•œ ๋ฌธ์ œ. GPU ์˜คํ”„๋กœ๋“œ ์„ค์ • ์กฐ์ •, ์–‘์žํ™” ๋‚ฎ์€ ๋ชจ๋ธ ์„ ํƒ, ํŒŒ์ผ ๊ฒฝ๋กœ ํ™•์ธ.
์‘๋‹ต ์†๋„ ๋А๋ฆผ ๋ชจ๋ธ ํฌ๊ธฐ ๊ณผ๋‹ค ๋˜๋Š” CPU ์—ฐ์‚ฐ ์˜์กด. ์ž‘์€ ๋ชจ๋ธ๋กœ ๋ณ€๊ฒฝํ•˜๊ฑฐ๋‚˜ GPU ์˜คํ”„๋กœ๋“œ ์„ค์ •์„ ๋Š˜๋ฆฝ๋‹ˆ๋‹ค.
์˜ค๋ฅ˜ ๋ฉ”์‹œ์ง€ ๋ฐœ์ƒ ํŒจํ‚ค์ง€ ์ถฉ๋Œ (๊ฐœ๋ฐœ์ž ๋ชจ๋“œ ์‹œ) ๋˜๋Š” ๋“œ๋ผ์ด๋ฒ„ ๋ฌธ์ œ. ๊ฐ€์ƒํ™˜๊ฒฝ์„ ์žฌ์„ค์น˜ํ•˜๊ฑฐ๋‚˜ NVIDIA ๋“œ๋ผ์ด๋ฒ„๋ฅผ ์ตœ์‹  ๋ฒ„์ „์œผ๋กœ ์—…๋ฐ์ดํŠธํ•ฉ๋‹ˆ๋‹ค.

์ปดํ“จํ„ฐ AI ์„ค์น˜๋Š” ๋” ์ด์ƒ ์ „๋ฌธ๊ฐ€์˜ ์˜์—ญ์ด ์•„๋‹™๋‹ˆ๋‹ค. LM Studio์™€ ๊ฐ™์€ ๋„๊ตฌ๋ฅผ ํ†ตํ•ด ์ดˆ๋ณด์ž๋„ ํ•˜๋“œ์›จ์–ด ๊ธฐ๋ณธ ์กฐ๊ฑด๋งŒ ๊ฐ–์ถ˜๋‹ค๋ฉด ๋ˆ„๊ตฌ๋‚˜ ์ž์‹ ๋งŒ์˜ ๋กœ์ปฌ AI ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•˜๊ณ , ๊ฐœ์ธ ์ •๋ณด ๊ฑฑ์ • ์—†์ด ๋ฌดํ•œํ•œ ํ™œ์šฉ์„ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


Q1: ์ปดํ“จํ„ฐ์— AI ์„ค์น˜๋ฐฉ๋ฒ•์„ ๋”ฐ๋ผ ํ–ˆ๋Š”๋ฐ ๋ชจ๋ธ์ด ๋กœ๋“œ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์™œ ๊ทธ๋Ÿฐ๊ฐ€์š”?

A1: ๋Œ€๋ถ€๋ถ„ VRAM ๋ถ€์กฑ์ด๋‚˜ GGUF ํŒŒ์ผ ์†์ƒ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. GPU ์˜คํ”„๋กœ๋“œ๋ฅผ ์ค„์ด๊ฑฐ๋‚˜, ์–‘์žํ™” ๋ ˆ๋ฒจ์ด ๋‚ฎ์€ ๋ชจ๋ธ์„ ์„ ํƒํ•ด ๋ณด์„ธ์š”. ๋˜ํ•œ, ํŒŒ์ผ ๊ฒฝ๋กœ์— ํ•œ๊ธ€์ด๋‚˜ ํŠน์ˆ˜ ๋ฌธ์ž๊ฐ€ ์—†๋„๋ก ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Q2: ์„ค์น˜ํ•œ AI ๋ชจ๋ธ์„ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

A2: ์˜ˆ, ๋กœ์ปฌ ์„ค์น˜ ๋ชจ๋ธ์€ ์ธํ„ฐ๋„ท ์—†์ด๋„ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ์ดˆ๊ธฐ ๋‹ค์šด๋กœ๋“œ์™€ ์—…๋ฐ์ดํŠธ ์‹œ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Q3: OpenAI ํ˜ธํ™˜ API ์„œ๋ฒ„๋ฅผ ์—ฐ๋™ํ•˜๋ฉด ์™ธ๋ถ€ ํ”„๋กœ๊ทธ๋žจ์—์„œ๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

A3: ๋„ค, ํŒŒ์ด์ฌ, ์ž๋ฐ”์Šคํฌ๋ฆฝํŠธ, ๊ธฐํƒ€ API ํ˜ธ์ถœ ๊ฐ€๋Šฅํ•œ ํ”„๋กœ๊ทธ๋žจ์—์„œ localhost ์„œ๋ฒ„๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Q4: ์ดˆ๋ณด์ž๊ฐ€ ์ฒ˜์Œ ์„ค์น˜ํ•  ๋•Œ ๊ฐ€์žฅ ์ฃผ์˜ํ•  ์ ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

A4: ์ปดํ“จํ„ฐ์— AI ์„ค์น˜๋ฐฉ๋ฒ• ๊ณผ์ •์—์„œ ํŒŒ์ผ ์šฉ๋Ÿ‰๊ณผ VRAM ์š”๊ตฌ ์‚ฌํ•ญ์„ ํ™•์ธํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ ์„ ํƒ ์‹œ PC ์‚ฌ์–‘์„ ๊ณ ๋ คํ•ด์•ผ ์„ค์น˜ ์˜ค๋ฅ˜๋ฅผ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Q5: ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ์„ค์น˜ํ–ˆ์„ ๋•Œ, ์ž์›์„ ํšจ์œจ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์€?

A5: ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ๋ชจ๋ธ์€ ๋กœ๋“œํ•˜์ง€ ์•Š๊ณ  ํ•„์š”ํ•  ๋•Œ๋งŒ ๋กœ๋“œํ•˜๋ฉฐ, GPU ์˜คํ”„๋กœ๋“œ ์„ค์ •์„ ์กฐ์ •ํ•ด VRAM ์‚ฌ์šฉ๋Ÿ‰์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.


๋ˆ„๊ตฌ๋‚˜ ์ปดํ“จํ„ฐ์— AI ์„ค์น˜๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๊ณ , ํ…Œ์ŠคํŠธํ•˜๋ฉฐ, ์—…๋ฌด์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Latest in this category

    ์ฟ ํŒกํŒŒํŠธ๋„ˆ์Šค API V2 ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ์‹ ์ƒํ’ˆ ๋ฐ ์ธ๊ธฐ์ƒํ’ˆ์ด ์ž๋™ ๋…ธ์ถœ๋ฉ๋‹ˆ๋‹ค.

    AI ์ฑ—๋ด‡์œผ๋กœ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๋น ๋ฅด๊ฒŒ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฉˆ์ถค
    ๋…ธ๋ž˜ ์žฌ์ƒ ๋ฉˆ์ถค