Skip to content
IT/AI

์ตœ์‹  ๋ฌด๋ฃŒ AI ๋ชจ๋ธ ๋น„๊ต ๋ฐ ํ™œ์šฉ๋ฒ•: ์ €์‚ฌ์–‘~์„œ๋ฒ„๊ธ‰ ์ „์ฒด ์ •๋ฆฌ

๋ฌด๋ฃŒ AI ๋ชจ๋ธ ์ €์‚ฌ์–‘๋ถ€ํ„ฐ ๊ณ ์‚ฌ์–‘๊นŒ์ง€ ์ „์ฒด ์ •๋ฆฌ

์ตœ๊ทผ ์ธ๊ณต์ง€๋Šฅ ๊ธฐ์ˆ ์ด ๊ธ‰๊ฒฉํžˆ ๋ฐœ์ „ํ•˜๋ฉด์„œ, ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ๊ธ€์“ฐ๊ธฐ, ์š”์•ฝ, ๋Œ€ํ™”, AI ์ฝ”๋”ฉ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ๊ฐœ์ธ PC์—์„œ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•ด์กŒ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋กœ์ปฌ AI ๋ชจ๋ธ์€ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด๋„ ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ๋ฅผ ์™„๋ฒฝํ•˜๊ฒŒ ๋ณด์žฅํ•˜๋ฉฐ, GPT์™€ ์œ ์‚ฌํ•œ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ด๋ฒˆ ๊ธ€์—์„œ๋Š” ์ด๋Ÿฌํ•œ ์˜คํ”ˆ์†Œ์Šค LLM์„ ์ €์‚ฌ์–‘๋ถ€ํ„ฐ ์ดˆ๊ณ ์‚ฌ์–‘๊นŒ์ง€ ๊ฐœ์ธ ์ปดํ“จํ„ฐ AI ํ™˜๊ฒฝ์— ๋งž์ถฐ ์„ธ๋ถ„ํ™”ํ•˜์—ฌ, ๊ฐ ๋ชจ๋ธ์˜ ํŠน์ง•, ํ•„์š”ํ•œ ์„ค์น˜ ํ™˜๊ฒฝ, ๊ทธ๋ฆฌ๊ณ  ์‹ค์งˆ์ ์ธ ํ™œ์šฉ๋ฒ•๊นŒ์ง€ ์ƒ์„ธํ•˜๊ฒŒ ์ •๋ฆฌํ–ˆ์Šต๋‹ˆ๋‹ค.

์ €์‚ฌ์–‘ ๋ชจ๋ธ: CPU ๋˜๋Š” 4~6GB VRAM์œผ๋กœ ์‹œ์ž‘ํ•˜๋Š” ๋กœ์ปฌ AI

์ €์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ ๋ณ„๋„์˜ ๊ณ ์„ฑ๋Šฅ ๊ทธ๋ž˜ํ”ฝ ์นด๋“œ๊ฐ€ ์—†๊ฑฐ๋‚˜ VRAM์ด 4GB์—์„œ 6GB ์ˆ˜์ค€์ธ ์ผ๋ฐ˜ ๋…ธํŠธ๋ถ, ๋˜๋Š” RAM 8~16GB์˜ ์‚ฌ๋ฌด์šฉ PC์—์„œ๋„ ์›ํ™œํ•˜๊ฒŒ ๊ตฌ๋™ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ GGUF (GPT-GGML Unified Format)์™€ ๊ฐ™์€ ์–‘์žํ™”(Quantization) ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ํš๊ธฐ์ ์œผ๋กœ ์ค„์—ฌ, ๋‚ฎ์€ ์‚ฌ์–‘์—์„œ๋„ ์ปดํ“จํ„ฐ์—AI ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ํ•ต์‹ฌ ์ฃผ์—ญ์ž…๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ๋“ค์€ ์ดˆ๊ธฐ ํ•™์Šต์šฉ, ๊ฐœ์ธ ํ”„๋กœ์ ํŠธ, ๋ธ”๋กœ๊ทธ ์ž‘์„ฑ ๋“ฑ์— ์ ํ•ฉํ•˜๋ฉฐ, ์ ‘๊ทผ์„ฑ์ด ๋›ฐ์–ด๋‚˜ ๋ˆ„๊ตฌ๋‚˜ ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, AI ๊ธ€์“ฐ๊ธฐ๋‚˜ ๊ฐ„๋‹จํ•œ AI ์ฝ”๋”ฉ ์ดˆ์•ˆ์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ๋งค์šฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ๋ช… ํฌ๊ธฐ ํ•„์š” ์‚ฌ์–‘ ํŠน์ง• ์ฃผ์š” ์šฉ๋„
GPT-2 (OpenAI) 124M~1.5B CPU/๋žจ 4GB ๊ฐ€์žฅ ๊ฐ€๋ณ๊ณ  ์•ˆ์ •์ , ๋‹ค์–‘ํ•œ ๋ฌธ์žฅ ํŒจํ„ด ์ง€์›, ๊ธฐ๋ณธ NLP ์ž‘์—…์šฉ ๊ธ€ ์ƒ์„ฑ, ๋ฌธ์žฅ ํ™•์žฅ, ๊ฐ„๋‹จํ•œ ์ฑ—๋ด‡
GPT-J 6B 6B VRAM 4~6GB GPT ๊ณ„์—ด ์˜คํ”ˆ๋ชจ๋ธ, ์•ˆ์ •์ ์ด๊ณ  ๋‹ค๋ชฉ์ . 4GB VRAM GPU์—์„œ๋„ ๊ตฌ๋™ ๊ฐ€๋Šฅ ์ฑ—๋ด‡, ํ…์ŠคํŠธ ์ƒ์„ฑ, ์†Œ๊ทœ๋ชจ ํ”„๋กœ์ ํŠธ
LLaMA 2 7B (GGUF) 7B CPU ๊ฐ€๋Šฅ, RAM 8GB ํ•œ๊ตญ์–ด ์ง€์› ์šฐ์ˆ˜, AI ๊ธ€์“ฐ๊ธฐ ๋ฐ ๋ฌธ์„œ ์ž‘์„ฑ์— ์ตœ์ . GGUF ์–‘์žํ™” ํ•„์ˆ˜ ๋ธ”๋กœ๊ทธ ๊ธ€ ์ƒ์„ฑ, ๋ฌธ์„œ ์š”์•ฝ, ํ•™์Šต์šฉ
Phi-2 (Microsoft) 2.7B ๋ฉ”๋ชจ๋ฆฌ 4~8GB ์ž‘์€ ํฌ๊ธฐ ๋Œ€๋น„ ๋งค์šฐ ๋›ฐ์–ด๋‚œ ๋…ผ๋ฆฌ ๋ฐ ์ถ”๋ก  ์„ฑ๋Šฅ ๊ต์œก์šฉ, ์š”์•ฝ, ๋…ผ๋ฆฌ์  ๋Œ€ํ™”
Mistral 7B 7B VRAM 4~6GB ์„ฑ๋Šฅ ๋Œ€๋น„ ๋งค์šฐ ๊ฐ€๋ฒผ์›€, ์ถ”๋ก  ์†๋„๊ฐ€ ๋น ๋ฆ„ ์ผ๋ฐ˜ ๋Œ€ํ™”, ๋ฌธ์„œ ์ž‘์„ฑ, ๋กœ์ปฌ AI ํ…Œ์ŠคํŠธ
Qwen 2 1.5B/7B 1.5~7B ์ €์‚ฌ์–‘ GPU ๋‹ค๊ตญ์–ด ์ง€์› ๊ฐ•๋ ฅ, ์•ˆ์ •์ ์ธ ๊ตฌ์กฐ ์ฑ„ํŒ…, ์š”์•ฝ, ๋‹ค๊ตญ์–ด ์ฒ˜๋ฆฌ, ์ดˆ๊ธ‰ ์ฝ”๋”ฉ

์ €์‚ฌ์–‘ ๋ชจ๋ธ์„ ์„ ํƒํ•  ๋•Œ๋Š” GPU VRAM์ด ๋ถ€์กฑํ•œ ๊ฒฝ์šฐ CPU ์˜คํ”„๋กœ๋“œ(Offload)๊ธฐ๋Šฅ์„ ํ™œ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. VRAM 4GB ์ด์ƒ์˜ ์—”๋น„๋””์•„ GPU๊ฐ€ ์žˆ๋‹ค๋ฉด ํ›จ์”ฌ ์•ˆ์ •์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๊ธ€ ์ž‘์„ฑ์ด๋‚˜ ๋ธ”๋กœ๊ทธ ์š”์•ฝ์—๋Š” LLaMA 2 7B GGUF๋‚˜ Mistral 7B ๋ชจ๋ธ์ด ๊ฐ€์žฅ ์ ํ•ฉํ•˜๋ฉฐ, ์ด๋“ค์€ ๋‚ฎ์€ ์‹œ์Šคํ…œ ์š”๊ตฌ์‚ฌํ•ญ์œผ๋กœ ์ธํ•ด ํ•™์Šต ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•˜์ง€ ์•Š๊ณ ๋„ ๋ฐ”๋กœ ๋กœ์ปฌ AI ํ™˜๊ฒฝ์—์„œ ํ…Œ์ŠคํŠธํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

์ค‘์‚ฌ์–‘ ๋ชจ๋ธ: 6~12GB VRAM์œผ๋กœ ์ „๋ฌธ์ ์ธ AI ์ฝ”๋”ฉ ๋ฐ ๋ฌธ์„œ ์ƒ์„ฑ

์ค‘์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ RTX 3060 (12GB), RTX 4060 ๋“ฑ ์ฃผ๋ฅ˜ ๊ฒŒ์ด๋ฐ GPU ๋˜๋Š” ๊ณ ๊ธ‰ ๋…ธํŠธ๋ถ ์ •๋„์˜ ์„ฑ๋Šฅ์„ ์š”๊ตฌํ•˜๋ฉฐ, GPU VRAM 6GB์—์„œ 12GB ์ˆ˜์ค€์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„๋ถ€ํ„ฐ๋Š” ๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๋ฌธ๋งฅ ์ดํ•ด๋„๊ฐ€ ๋น„์•ฝ์ ์œผ๋กœ ํ–ฅ์ƒ๋˜์–ด, ๋‹จ์ˆœํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ์„ ๋„˜์–ด AI ์ฝ”๋”ฉ, ๋ณต์žกํ•œ ๋Œ€ํ™”ํ˜• AI, ๊ทธ๋ฆฌ๊ณ  ์ „๋ฌธ์ ์ธ ๊ณ ํ’ˆ์งˆ ๋ฌธ์„œ ์ƒ์„ฑ๊นŒ์ง€ ํ™œ์šฉ ๋ฒ”์œ„๊ฐ€ ๋„“์–ด์ง‘๋‹ˆ๋‹ค.

๋ชจ๋ธ๋ช… ํฌ๊ธฐ ํ•„์š” ์‚ฌ์–‘ ํŠน์ง• ์ฃผ์š” ์šฉ๋„
LLaMA 3 8B 8B GPU 6~8GB ๋ฉ”ํƒ€์˜ ์ตœ์‹  ๋ชจ๋ธ, ์ด์ „ ์„ธ๋Œ€ ๋Œ€๋น„ ์ถ”๋ก  ์„ฑ๋Šฅ ๋Œ€ํญ ํ–ฅ์ƒ ์ „๋ฌธ ๋Œ€ํ™”, AI ์ฝ”๋”ฉ ์ดˆ์•ˆ ์ž‘์„ฑ, ๋ณต์žกํ•œ ์งˆ๋ฌธ ์ฒ˜๋ฆฌ
LLaMA 2 13B 13B GPU 10~12GB ์•ˆ์ •์ ์ด๊ณ  ๊ณ ํ’ˆ์งˆ์˜ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋Šฅ๋ ฅ ์ œ๊ณต ๋ธ”๋กœ๊ทธ ์ž‘์„ฑ, ์žฅ๋ฌธ ์š”์•ฝ, ๋…ผ๋ฌธ ์ดˆ์•ˆ
Mixtral 8x7B (MoE) 87B VRAM 8~12GB MoE(Mixture of Experts) ๊ตฌ์กฐ๋กœ, ํฌ๊ธฐ ๋Œ€๋น„ ๋น ๋ฅด๊ณ  ๋งค์šฐ ์ •ํ™•ํ•œ ์‘๋‹ต ๊ณ ์„ฑ๋Šฅ ๋Œ€ํ™”, ์ •๊ตํ•œ ๋ฌธ์„œ ์ƒ์„ฑ, ์ฐฝ์ž‘๋ฌผ ๋ณด์กฐ
Qwen 2 14B 14B GPU 10~12GB ํ•œ๊ตญ์–ด ๊ฐ•์ ์ด ๋šœ๋ ทํ•˜๋ฉฐ, ๋‹ค๊ตญ์–ด ์ฒ˜๋ฆฌ ๋ฐ ๋ฒˆ์—ญ ์„ฑ๋Šฅ ์šฐ์ˆ˜ ์ฐฝ์ž‘, ์ฝ”๋”ฉ, ์ „๋ฌธ ๋ฒˆ์—ญ ๋ฐ ์š”์•ฝ
Gemma 2 9B (Google) 9B GPU 8GB ๊ตฌ๊ธ€์˜ ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ, ์•ˆ์ •์„ฑ ๋†’๊ณ  ์œค๋ฆฌ ๊ธฐ์ค€ ์ค€์ˆ˜ ์—…๋ฌด์šฉ ์ฑ—๋ด‡, ๋Œ€ํ™”ํ˜• ์„œ๋น„์Šค, ๋ถ„์„

์ค‘์‚ฌ์–‘ ์˜คํ”ˆ์†Œ์Šค LLM์„ ํ™œ์šฉํ•  ๋•Œ๋Š” GPU VRAM์„ ์ตœ๋Œ€ํ•œ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. LM Studio๋‚˜ Ollama์™€ ๊ฐ™์€ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ GPU ์˜คํ”„๋กœ๋“œ ์„ค์ •์„ ์ตœ์ ํ™”ํ•˜๋ฉด, ๋” ๋น ๋ฅด๊ณ  ์ •ํ™•ํ•œ ์‘๋‹ต์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋“ค์€ ์–ด๋А ์ •๋„ AI ์‚ฌ์šฉ ๊ฒฝํ—˜์ด ์žˆ๋Š” ์‚ฌ์šฉ์ž์—๊ฒŒ ์ ํ•ฉํ•˜๋ฉฐ, ํŠนํžˆ Mixtral 8x7B๋Š” ๋›ฐ์–ด๋‚œ ํšจ์œจ์„ฑ์œผ๋กœ ๋งŽ์€ ์ธ๊ธฐ๋ฅผ ์–ป๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ: 16~24GB VRAM์œผ๋กœ GPT-4๊ธ‰ ์„ฑ๋Šฅ ๊ฒฝํ—˜

์ด์ œ ๋ณธ๊ฒฉ์ ์œผ๋กœ ์ „๋ฌธ๊ฐ€์šฉ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ ์˜์—ญ์ž…๋‹ˆ๋‹ค. ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ์€ RTX 4090 (24GB)๊ณผ ๊ฐ™์€ ํ”Œ๋ž˜๊ทธ์‹ญ GPU ๋˜๋Š” ์ „๋ฌธ๊ฐ€์šฉ ์›Œํฌ์Šคํ…Œ์ด์…˜ ํ™˜๊ฒฝ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. VRAM 16GB์—์„œ 24GB ์ด์ƒ์ด ํ•„์š”ํ•˜๋ฉฐ, ๋Œ€๊ทœ๋ชจ ํ…์ŠคํŠธ ์ƒ์„ฑ, ์ „๋ฌธ ๊ธ€์“ฐ๊ธฐ, ์‹ฌ์ธต ๋ถ„์„, ๋ณต์žกํ•œ ์ฐฝ์ž‘ ๋“ฑ ๊ณ ๊ธ‰ ํ™œ์šฉ์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ์–‘์žํ™”๋ฅผ ํ†ตํ•ด ๋‹จ์ผ GPU์—์„œ ๊ตฌ๋™์ด ๊ฐ€๋Šฅํ•ด์ง€๋ฉด์„œ, ๊ฐœ์ธ๋„ GPT-4์ˆ˜์ค€์˜ ์ถ”๋ก  ์„ฑ๋Šฅ์„ ๋กœ์ปฌ AI ํ™˜๊ฒฝ์—์„œ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋Œ€ํ‘œ์ ์ธ ๊ณ ์‚ฌ์–‘ ์˜คํ”ˆ์†Œ์Šค LLM์œผ๋กœ๋Š” LLaMA 3 70B, Mixtral 8x22B, Qwen 2 72B, Gemma 2 27B ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ์ •ํ™•์„ฑ๊ณผ ๋…ผ๋ฆฌ์  ์ผ๊ด€์„ฑ์—์„œ ์ƒ์—…์šฉ ๋ชจ๋ธ๊ณผ ๊ฒฌ์ค„ ๋งŒํ•œ ์ˆ˜์ค€์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๋ชจ๋ธ๋ช… ํฌ๊ธฐ ํ•„์š” ์‚ฌ์–‘ ํŠน์ง• ์ฃผ์š” ์šฉ๋„
LLaMA 3 70B 70B VRAM 48~70GB (๋ถ„์‚ฐ ๊ฐ€๋Šฅ) GPT-3.5~4๊ธ‰ ์„ฑ๋Šฅ, ๋ณต์žกํ•œ ์ถ”๋ก  ๋ฐ ์ „๋ฌธ ๊ธ€์“ฐ๊ธฐ ์ตœ์  ์ „๋ฌธ๊ฐ€ ๊ธ€์“ฐ๊ธฐ, AI ์ฝ”๋”ฉ ๋ฐ ๋””๋ฒ„๊น…, ๋ฐ์ดํ„ฐ ๋ถ„์„
Mixtral 8x22B (MoE) MoE VRAM 24GB ์ด์ƒ ๋›ฐ์–ด๋‚œ MoE ํšจ์œจ์„ฑ์œผ๋กœ ๋น ๋ฅด๊ณ  ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ ์ œ๊ณต ์‹ฌ์ธต ๋ถ„์„, ๊ณ ํ’ˆ์งˆ ์š”์•ฝ, ๋ณต์žกํ•œ ์ฐฝ์ž‘
Qwen 2 72B 72B 48GB ์ด์ƒ(๋ถ„์‚ฐ ์ถ”์ฒœ) ๋‹ค๊ตญ์–ด ์ง€์› ์ตœ๊ฐ•, ๋ฐฉ๋Œ€ํ•œ ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ ๊ณ ๊ธ‰ ์ฑ—๋ด‡, ์žฅํŽธ ์ฐฝ์ž‘, ๋‹ค๊ตญ์–ด ํ”„๋กœ์ ํŠธ
Gemma 2 27B 27B 24GB VRAM ๊ตฌ๊ธ€์˜ ๊ณ ํ’ˆ์งˆ ๋ชจ๋ธ, ๋Œ€ํ™” ๋ฐ ์—ฐ๊ตฌ์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ์— ์šฐ์ˆ˜ ๋Œ€ํ™”, ๋ถ„์„, ์—ฐ๊ตฌ์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ

๊ณ ์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ VRAM 24GB ๋‹จ์ผ GPU๋กœ ๊ตฌ๋™์ด ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์ด ๋งŽ์ง€๋งŒ, LLaMA 3 70B์™€ ๊ฐ™์€ ์ดˆ๋Œ€ํ˜• ๋ชจ๋ธ์€ ๋‘ ๊ฐœ ์ด์ƒ์˜ GPU๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋ถ„์‚ฐ ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉํ•˜๋ฉด ๋”์šฑ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์•ˆ์ •์„ฑ๊ณผ ์ถ”๋ก  ์†๋„๋ฅผ ๋™์‹œ์— ํ™•๋ณดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ๋†’์€ ํ’ˆ์งˆ์˜ ๊ฒฐ๊ณผ๋ฌผ์„ ํ•„์š”๋กœ ํ•˜๋Š” ์ฐฝ์ž‘, ๋ฒˆ์—ญ, ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ „๋ฌธ๊ฐ€๋“ค์—๊ฒŒ ํŠนํžˆ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

์ดˆ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ: ๊ฐœ์ธ PC๋กœ ๊ตฌ๋™ ๋ถˆ๊ฐ€๋Šฅํ•œ ์—ฐ๊ตฌ ๋ฐ ๊ธฐ์—…์šฉ LLM

์ดˆ๊ณ ์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ๊ฐœ์ธ ์ปดํ“จํ„ฐ AI ํ™˜๊ฒฝ์—์„œ ๊ตฌ๋™ํ•  ์ˆ˜ ์—†์œผ๋ฉฐ, ์ตœ์†Œ ์ˆ˜์‹ญ ์žฅ์˜ GPU๊ฐ€ ์—ฐ๊ฒฐ๋œ ์„œ๋ฒ„๊ธ‰ ํ™˜๊ฒฝ์ด๋‚˜ ๋Œ€๊ทœ๋ชจ ์—ฐ๊ตฌ์šฉ ํด๋Ÿฌ์Šคํ„ฐ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ 100B๋ฅผ ํ›Œ์ฉ ๋„˜๊ธฐ๋ฉฐ, GPT-4์™€ ์œ ์‚ฌํ•˜๊ฑฐ๋‚˜ ๊ทธ ์ด์ƒ์˜ ์ตœ๊ณ  ์ˆ˜์ค€ ์„ฑ๋Šฅ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

๋ฌด๋ฃŒ AI ์†Œ๊ฐœ ๋ฐ ์ถ”์ฒœ

์ด๋Ÿฌํ•œ ์˜คํ”ˆ์†Œ์Šค LLM์€ ๊ธฐ์—…์šฉ ์†”๋ฃจ์…˜, ํ•™์ˆ  ์—ฐ๊ตฌ, ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ๋ถ„์„, ๊ทธ๋ฆฌ๊ณ  ์ตœ์ฒจ๋‹จ AI ์—ฐ๊ตฌ ๊ฐœ๋ฐœ ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋น„๋ก ๋กœ์ปฌ์—์„œ ์ง์ ‘ ๊ตฌ๋™์€ ์–ด๋ ต์ง€๋งŒ, ํด๋ผ์šฐ๋“œ ์ปดํ“จํŒ… ์„œ๋น„์Šค(AWS, Google Cloud, Azure)๋ฅผ ํ†ตํ•ด API ํ˜•ํƒœ๋กœ ์ ‘๊ทผํ•˜์—ฌ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ๋ช… ํฌ๊ธฐ ํŠน์ง• ์ˆ˜์ค€
LLaMA 3 405B 405B GPT-4๊ธ‰, ์ดˆ๋Œ€๊ทœ๋ชจ, ์ดˆ๊ณ ์„ฑ๋Šฅ ์ตœ์ฒจ๋‹จ ์—ฐ๊ตฌ์šฉ, ๋Œ€๊ทœ๋ชจ ํด๋ผ์šฐ๋“œ ์„œ๋ฒ„ ํ•„์š”
Qwen 2 110B~720B 110~720B ์ค‘๊ตญ๊ณ„ ์ตœ๊ณ  ๋ชจ๋ธ, ์ดˆ๋Œ€๊ทœ๋ชจ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ธฐ์—… ์†”๋ฃจ์…˜, ์—ฐ๊ตฌ, ๋Œ€๊ทœ๋ชจ ๋‹ค๊ตญ์–ด ํ”„๋กœ์ ํŠธ
Falcon 180B 180B ์ค‘๋™์—์„œ ๊ณต๊ฐœ, ๋งค์šฐ ๋ฐฉ๋Œ€ํ•œ ์ดˆ๊ฑฐ๋Œ€ LLM ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ๋ถ„์„, ๋ณตํ•ฉ ์—ฐ๊ตฌ
GPT-NeoX 20B (EleutherAI) 20B ์˜คํ”ˆ์†Œ์Šค ๊ธฐ๋ฐ˜, ๊ณ ๊ธ‰ ๋ถ„์„ ์ž‘์—…์— ์‚ฌ์šฉ ํ•™์ˆ  ๋ฐ ์‹คํ—˜์šฉ, ๋Œ€ํ˜• GPU ํด๋Ÿฌ์Šคํ„ฐ ํ•„์š”

์ด๋“ค ์ดˆ๊ณ ์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ ์ผ๋ฐ˜ ์‚ฌ์šฉ์ž๊ฐ€ ์ง์ ‘ ๊ตฌ๋™ํ•˜๊ธฐ ์–ด๋ ต์ง€๋งŒ, ์ด๋“ค์˜ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋Š” ์ค‘์‚ฌ์–‘ ๋ฐ ๊ณ ์‚ฌ์–‘ ๋กœ์ปฌ AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ์ง€์†์ ์œผ๋กœ ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ง์ ‘ ๊ตฌ๋™์ด ์–ด๋ ต๋‹ค๋ฉด, ํด๋ผ์šฐ๋“œ ํ™˜๊ฒฝ์„ ํ™œ์šฉํ•˜์—ฌ ์ด ๋ชจ๋ธ๋“ค์˜ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ ์„ ํƒ ๋ฐ ํ™œ์šฉ ํŒ: PC์— AI ํ™˜๊ฒฝ ์ตœ์ ํ™” ์ „๋žต

์„ฑ๊ณต์ ์ธ ๊ฐœ์ธ ์ปดํ“จํ„ฐ AI ํ™˜๊ฒฝ ๊ตฌ์ถ•์„ ์œ„ํ•ด ๋ชจ๋ธ์„ ์„ ํƒํ•  ๋•Œ๋Š” ๋‹ค์Œ ๊ธฐ์ค€์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค:

  • ์‹œ์Šคํ…œ ์‚ฌ์–‘ ๋ฐ ์–‘์žํ™”: RAM, GPU VRAM, CPU ์ฝ”์–ด ์ˆ˜๋ฅผ ์ •ํ™•ํžˆ ํ™•์ธํ•˜๊ณ , VRAM์ด ๋ถ€์กฑํ•˜๋‹ค๋ฉด ๋ฐ˜๋“œ์‹œ GGUF ํฌ๋งท์˜ ์–‘์žํ™”๋œ ๋ชจ๋ธ(Q4, Q5 ๋“ฑ)์„ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชฉ์  ์ผ์น˜: ๋ธ”๋กœ๊ทธ ๊ธ€์“ฐ๊ธฐ, ์ฝ”๋”ฉ, ์š”์•ฝ, ๋‹ค๊ตญ์–ด ํ”„๋กœ์ ํŠธ, ์ฑ—๋ด‡ ๋“ฑ ๋ชฉ์ ์— ๋”ฐ๋ผ ์ตœ์ ํ™”๋œ ๋ชจ๋ธ(์˜ˆ: ์ฝ”๋”ฉ์€ LLaMA 3, ๋‹ค๊ตญ์–ด๋Š” Qwen)์„ ์„ ํƒํ•ด์•ผ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค.
  • ์„ฑ๋Šฅ ๋Œ€๋น„ ํšจ์œจ (ํ† ํฐ ์ƒ์„ฑ ์†๋„): ๋ฌด์กฐ๊ฑด ํฌ๊ธฐ๊ฐ€ ํฐ ๋ชจ๋ธ๋ณด๋‹ค๋Š”, Mixtral์ฒ˜๋Ÿผ MoE ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์†๋„ ๋Œ€๋น„ ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚œ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ์‹ค์ œ ์‚ฌ์šฉ ํ™˜๊ฒฝ์—์„œ ๋” ๋งŒ์กฑ๋„๊ฐ€ ๋†’์Šต๋‹ˆ๋‹ค.
  • ์„ค์น˜ ํŽธ์˜์„ฑ: ์ดˆ๋ณด์ž์˜ ๊ฒฝ์šฐ LM Studio๋‚˜ Ollama์™€ ๊ฐ™์ด ํด๋ฆญ ๋ช‡ ๋ฒˆ์œผ๋กœ ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์‹คํ–‰์ด ๊ฐ€๋Šฅํ•œ ์˜ฌ์ธ์› ์†”๋ฃจ์…˜์„ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.
  • ๋ถ„์‚ฐ ํ™˜๊ฒฝ ๊ณ ๋ ค: ๊ณ ์‚ฌ์–‘ ์ด์ƒ ๋ชจ๋ธ์„ ๋กœ์ปฌ์—์„œ ์‚ฌ์šฉํ•˜๋ ค๋ฉด, vLLM๊ณผ ๊ฐ™์€ ์ „๋ฌธ ์ถ”๋ก  ์—”์ง„์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, ์—ฌ๋Ÿฌ GPU๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋ถ„์‚ฐ ํ™˜๊ฒฝ ๊ตฌ์ถ•์„ ๊ณ ๋ คํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

๋ฌด๋ฃŒ AI ๋ชจ๋ธ์„ ๋ชฉ์ ๊ณผ ์‚ฌ์–‘์— ๋งž๊ฒŒ ์„ ํƒํ•˜๊ณ  ์ตœ์ ํ™”ํ•˜๋ฉด, ์ ์€ ์ž์›์œผ๋กœ๋„ ํšจ์œจ์ ์ธ AI ํ™œ์šฉ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๊ฐœ์ธ ํ”„๋กœ์ ํŠธ์šฉ์ด๋ผ๋ฉด ์ €์‚ฌ์–‘ ๋ชจ๋ธ, ์ „๋ฌธ ์ฐฝ์ž‘๊ณผ ์—ฐ๊ตฌ์—๋Š” ๊ณ ์‚ฌ์–‘ ์ด์ƒ ๋ชจ๋ธ์ด ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.


Q1. ์ €์‚ฌ์–‘ ๋ชจ๋ธ๊ณผ ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ์˜ ๊ฐ€์žฅ ํฐ ์ฐจ์ด๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”?

์ €์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ CPU ๋˜๋Š” 4~6GB VRAM์—์„œ๋„ ๊ตฌ๋™ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๊ฐ„๋‹จํ•œ ๊ธ€ ์ƒ์„ฑ๊ณผ ๋Œ€ํ™”์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ์€ VRAM 16~24GB ์ด์ƒ์ด ํ•„์š”ํ•˜๊ณ , ์ „๋ฌธ์ ์ธ ๊ธ€์“ฐ๊ธฐ, ๋ถ„์„, ์ฝ”๋”ฉ ๋“ฑ ๊ณ ๊ธ‰ ์ž‘์—…์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

Q2. ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์„ ์„ ํƒํ•  ๋•Œ ์ฃผ์˜ํ•  ์ ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

์‹œ์Šคํ…œ ์‚ฌ์–‘๊ณผ ํ™œ์šฉ ๋ชฉ์ ์„ ๋ฐ˜๋“œ์‹œ ํ™•์ธํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ €์‚ฌ์–‘ ๋ชจ๋ธ์€ ์ ‘๊ทผ์„ฑ์ด ์ข‹์ง€๋งŒ ์„ฑ๋Šฅ์ด ์ œํ•œ์ ์ด๋ฉฐ, ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ์€ ๋ถ„์‚ฐ ํ™˜๊ฒฝ์ด๋‚˜ ์„œ๋ฒ„๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ•œ๊ตญ์–ด ์ง€์› ์—ฌ๋ถ€, ๋‹ค๊ตญ์–ด ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ ๋“ฑ๋„ ๊ณ ๋ คํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Q3. ์ดˆ๊ณ ์‚ฌ์–‘ ๋ชจ๋ธ์€ ์ผ๋ฐ˜ ๊ฐœ์ธ PC์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ๊ฐ€์š”?

์•„๋‹ˆ์š”. ์ดˆ๊ณ ์‚ฌ์–‘ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์€ ์ผ๋ฐ˜ PC๋กœ๋Š” ๊ตฌ๋™ํ•  ์ˆ˜ ์—†์œผ๋ฉฐ, ํด๋ผ์šฐ๋“œ ์„œ๋ฒ„๋‚˜ ์—ฐ๊ตฌ์šฉ ํด๋Ÿฌ์Šคํ„ฐ ํ™˜๊ฒฝ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. GPT-4๊ธ‰ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋ฉฐ, ์—ฐ๊ตฌ๊ธฐ๊ด€์ด๋‚˜ ๊ธฐ์—…์šฉ์œผ๋กœ ์ฃผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

Q4. ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ๋ธ”๋กœ๊ทธ ๊ธ€ ์ž‘์„ฑ์— ์ถ”์ฒœ ๋ชจ๋ธ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

์ €์‚ฌ์–‘ ๋ชจ๋ธ ์ค‘ LLaMA 2 7B GGUF, GPT-J 6B, Phi-2๊ฐ€ ๊ฐ€์žฅ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์†๋„๊ฐ€ ๋น ๋ฅด๊ณ  ์•ˆ์ •์ ์ด๋ฉฐ, ๋ธ”๋กœ๊ทธ ๊ธ€ ์ƒ์„ฑ๊ณผ ์š”์•ฝ, ๊ฐ„๋‹จํ•œ ์ฑ—๋ด‡ ๊ตฌํ˜„๊นŒ์ง€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

์ด์ฒ˜๋Ÿผ ๋ฌด๋ฃŒ AI ๋ชจ๋ธ์„ ์ €์‚ฌ์–‘๋ถ€ํ„ฐ ์ดˆ๊ณ ์‚ฌ์–‘๊นŒ์ง€ ์„ ํƒ ๊ธฐ์ค€๊ณผ ํ™œ์šฉ๋ฒ•๊นŒ์ง€ ๋ชจ๋‘ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•„์š”์— ๋”ฐ๋ผ ์ ํ•ฉํ•œ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๊ณ , ์ž์‹ ์˜ ์‹œ์Šคํ…œ ํ™˜๊ฒฝ์— ๋งž๊ฒŒ ์ตœ์ ํ™”ํ•˜๋ฉด, ํšจ์œจ์ ์ธ AI ํ™œ์šฉ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

Latest in this category

    ์ฟ ํŒกํŒŒํŠธ๋„ˆ์Šค API V2 ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ์‹ ์ƒํ’ˆ ๋ฐ ์ธ๊ธฐ์ƒํ’ˆ์ด ์ž๋™ ๋…ธ์ถœ๋ฉ๋‹ˆ๋‹ค.

    AI ์ฑ—๋ด‡์œผ๋กœ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๋น ๋ฅด๊ฒŒ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฉˆ์ถค
    ๋…ธ๋ž˜ ์žฌ์ƒ ๋ฉˆ์ถค