ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [업계 이야기] chatGPT 와 LLM에 λŒ€ν•œ 생각
    ML engineer/NLP 2023. 2. 19. 14:26
    λ°˜μ‘ν˜•

    πŸ•“ 5 mins read

    https://www.dw.com/en/chatgpt-is-changing-education-ai-experts-say-but-how/a-64454752

    이미 μž‘λ…„ 연말에 κ³΅κ°œλ˜μ—ˆμ§€λ§Œ, λ‚΄ μ£Όλ³€μ˜ 도메인 κ΄€κ³„μž μ™Έμ—λŠ” μ΄μ œμ•Ό λ‰΄μŠ€λ₯Ό 톡해 μ ‘ν–ˆλ‚˜ 보닀.
    λ§Œλ‚˜λŠ” μ‚¬λžŒλ“€ λ§ˆλ‹€ chatGPT이야기λ₯Ό ν•˜λŠ” κ±Έ λ³΄λ‹ˆ..

    λΉ…ν…Œν¬λ“€μ˜ 수μž₯듀이, Yann LeCun, Geoffrey Hinton 정도 λ˜λŠ” AI 3 λŒ€μž₯격인 μ‚¬λžŒλ“€λ„ chatGPT에 λŒ€ν•œ κ·Έλ“€μ˜ 생각을 κ³΅μœ ν–ˆμ§€λ§Œ, μ–΄μ¨Œλ“  λ‚˜λ„ ML/ NLP 업계 μ’…μ‚¬μžλ‘œμ„œ, 생각을 ν•œλ²ˆ 적어 보지 μ•Šμ„ μˆ˜κ°€ μ—†λ‹€. (λ„ˆλ¬΄ λ²ˆμ—­νˆ¬μ˜€λ‚˜?)


    # κ·Έλž˜μ„œ 정말 ν˜μ‹ μΈκ°€?

    기술적으둜 λŒ€λ‹¨μ€ ν•˜μ§€λ§Œ, ν˜μ‹ μ€ κΈ€μŽ„...
    μ‚¬μ—…μ μœΌλ‘œλŠ” λ―Έμ§€μ˜ μ˜μ—­μ— λŒ€ν•œ κ³Όκ°ν•œ 투자,
    λΉ„κΈ°μˆ μžμ˜ 관점에선 κ·Έμ € 신세계?

    기술적인 관점에선 λ‚˜ μ—­μ‹œ 같은 생각이닀. ν˜μ‹ ?이라기엔 이미 μ˜€λž˜μ „μ—(Attention is all you need 논문이 λ‚˜μ˜¨ 게 2017λ…„λ„μ˜€λ‚˜? λŒ€ν•™μ› μ‘Έμ—…ν•œ 지 μ–Όλ§ˆ μ•ˆ λ˜μ—ˆμ„ λ•Œμ˜€λ˜ 것 같은데..) λ‚˜μ˜¨ κΈ°μˆ μ—μ„œ νŠΉλ³„νžˆ λ‹€λ₯Ό 것도 μ—†κ³ , ν•΄λ‹Ή 기술의 근본적인 λ¬Έμ œλŠ” ν•΄κ²°ν•œ 게 μ•„λ‹ˆλ‹€.

    κ·Έμ € κ·ΈλŸ΄μ‹Έ ν•˜κ²Œ λ¬Έμž₯을 μƒμ„±ν•˜λ˜ λͺ¨λΈμ΄ "μ•„λ‹ˆ 정말 근데 μ§„μ§œ" κ·ΈλŸ΄μ‹Έν•œ λ¬Έμž₯(?)을 μƒμ„±ν•˜λŠ” λͺ¨λΈμ΄ λœκ²ƒμ΄λ‹€.

    ꡬ체적으둜 μ‚΄νŽ΄λ³΄λ©΄, λΆ„λͺ… OpenAIλŠ” chatGPTλΌλŠ” ν•œμˆœκ°„μ„ μœ„ν•΄ μˆ˜λ…„κ°„ 연ꡬλ₯Ό λΉŒλ“œμ—…ν•΄μ˜¨ 건 λ§žλ‹€. LLM의 연ꡬ νŠΈλ Œλ“œλ₯Ό μ„ λ„ν•œ 것도 κ·Έλ“€μ΄μ—ˆκ³ , μƒλ‹Ήν•œ ν•™μŠ΅ 데이터와 ν•™μŠ΅μ— ν•„μš”ν•œ μ»΄ν“¨νŒ… μžμ› νˆ¬μžλ“±λ„ λ―Έμ§€μ˜ μ˜μ—­μ— λŒ€ν•œ κ³Όκ°ν•œ 투자인 것도 λ§žλ‹€.

    거기에닀가 이 GPTλΌλŠ” κ±°λŒ€ LM(LLM)을 λŒ€ν™”ν˜•μœΌλ‘œ μ „ν™˜μ‹œν‚€κ³  이λ₯Ό μ„œλΉ„μŠ€ν™” ν•˜λŠ”λ° ν•„μš”ν•œ, "μ‚¬λžŒμ΄" μš©μΈν•  수 μžˆλŠ”, λ§ˆμŒμ— λ“œλŠ” 닡변을 내뱉도둝 λ¬Έμž₯λ ₯을 λ‹€λ“¬λŠ” 데 μ‚¬μš©λœ PPO(κ°•ν™”ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜) μ—­μ‹œ OpenAIμ—μ„œ 연ꡬ/κ°œλ°œν•œ μ•Œκ³ λ¦¬μ¦˜μ΄λ‹ˆ, 기쑴의 κΈ°μˆ μ„ μ‘μš©ν•œ, ν˜μ‹  μ—†λŠ” κΈ°μˆ μ΄λΌκΈ°μ—λ„ μ• λ§€ν•˜λ‹€. chatGPTκ°€ λŒ€λ‹¨ν•œ 연ꡬ라기 보단, κ·Έ 과정에 ν•„μš”ν–ˆλ˜ μž‘μ€ ν•˜λ‚˜ν•˜λ‚˜μ˜ λΉŒλ”©λΈ”λ‘μ„ 직접 연ꡬ κ°œλ°œν•œ κ²ƒμ΄λ‹ˆ, 잘 κ°ˆκ³ λ‹¦μ•„ μ„œλΉ„μŠ€ κ°€λŠ₯ν•œ μˆ˜μ€€κΉŒμ§€ λŒμ–΄μ˜¬λ¦° 것은 κΈ°μˆ μ μœΌλ‘œλ„ ꡉμž₯ν•œ 일이닀.

    ν•˜μ§€λ§Œ, 사업 κ΄€μ μ—μ„œ 봀을 땐, 이 λͺ¨λ“  일련의 μ—°κ΅¬μ˜ 끝에 μ—„μ²­λ‚œ μ„±λŠ₯ κ°œμ„ μ΄ μžˆμ„ κ²ƒμ΄λΌλŠ” 보μž₯은 μ—†μ—ˆλ‹€. λ¬Όλ‘ , μ•”κΈ°λ₯Ό 정말 μž˜ν•˜λŠ” λͺ¨λΈμ„ 더 크게 λ§Œλ“€μ–΄μ„œ 더 λ§Žμ€ 정보λ₯Ό κΈ°μ–΅ν•˜κ²Œ λ§Œλ“€κ³ , 더 λ‹€μ–‘ν•œ λ¬Έμž₯에 λŒ€ν•œ μˆ˜λ§Žμ€ λ°μ΄ν„°μ˜ 톡계λ₯Ό λ°”νƒ•μœΌλ‘œ λ¬Έμž₯을 λ§Œλ“€μ–΄λ‚Έλ‹€λ©΄ "더" κ·ΈλŸ΄λ“―ν•œ λ¬Έμž₯이 λ‚˜μ˜¬ κ²ƒμ΄λΌλŠ” 데엔 μ „λ¬Έκ°€κ°€ μ•„λ‹ˆλ”λΌλ„ λ‚©λ“ν• λ§Œν•œ μ˜ˆμƒμ΄λ‹€. κ·ΈλŸ¬λ‚˜, κ·Έλƒ₯ 이런 가섀을 검증해 보기엔 λ„ˆλ¬΄ λ§Žμ€ λΉ„μš©μ΄ ν•„μš”ν•œλ°...

    이걸 ν™•μ‹  없이 μ‹œλ„ν•΄ λ³΄λŠ” 것 μžμ²΄κ°€ μ‚¬μ—…μ μœΌλ‘œλŠ” λΆ„λͺ… κ³Όκ°ν•œ 투자이자, λͺ¨ν—˜μ΄μ—ˆμ„ 것이닀. λ‹¨μˆœνžˆ λͺ¨λΈμ„ ν‚€μš°λŠ” μ‹μœΌλ‘œ μ„±λŠ₯을 μ˜¬λ¦¬λŠ” 건 마치, μ†Œν”„νŠΈμ›¨μ–΄ κ°œλ°œμžκ°€ μ•Œκ³ λ¦¬μ¦˜ κ°œμ„  없이 ν•˜λ“œμ›¨μ–΄λ§Œ 더 쒋은 것을 κ΅¬λ§€ν•΄μ„œ μ„±λŠ₯을 μ˜¬λ¦¬λŠ” κ²ƒμ²˜λŸΌ λ¬΄μ‹ν•˜κ²Œ 보일뿐만 μ•„λ‹ˆλΌ λΉ„μš© 효율적인 방법은 μ•„λ‹ˆλ‹€. (ν•˜λ“œμ›¨μ–΄ 이야긴 κ·Έλ‚˜λ§ˆ μ„±λŠ₯이 κ°œμ„ λœλ‹€λŠ” 확신이라도 μžˆμ§€..)

    κ·ΈλŸ¬λ‚˜, λ§Œμ•½ 이 "μ„±λŠ₯ κ°œμ„ "의 μˆ˜μ€€μ΄, 90% 정확도λ₯Ό 92%둜 μ˜¬λ¦¬λŠ” μˆ˜μ€€μ΄ μ•„λ‹ˆλΌ, 기쑴에 μ „ν˜€ ν•˜μ§€ λͺ»ν•˜λ˜ 것쑰차도 ν•  수 μžˆλŠ”, 200% μ΄μƒμ˜ κ°œμ„ μ΄λΌλ©΄, μ΄μ•ΌκΈ°λŠ” 달라진닀.

    10가지 일을 μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄ 10개의 λͺ¨λΈμ„ ν•™μŠ΅ν•  λ•Œμ™€λŠ” 달리, 단 ν•˜λ‚˜μ˜ λͺ¨λΈλ‘œ 10가지 일을 λ„˜λ‚˜λ“€λ©΄μ„œ μ˜¨κ°– 정보λ₯Ό μ•„μš°λ₯΄κ³ , μ˜ˆμ‹œλ§Œ 보여주면 μƒˆλ‘œμš΄ μž…λ ₯에 λŒ€ν•΄μ„œλ„ ν›Œλ₯­ν•œ μˆ˜μ€€μœΌλ‘œ 이λ₯Ό λ°”λ‘œ 따라 ν•˜λŠ”λ°, λŒ€μ€‘μ˜ λˆˆμ—λŠ” 이건 마치...

    “Any sufficiently advanced technology is indistinguishable from magic.”

    by Arthur C. Clarke 

    그래, λ§ˆλ²•μ΄λΌ 해도 믿을 것이닀.

     

    # μ™œ κ°‘μž‘μŠ€λŸ½κ²Œ λ³΄μ΄λ‚˜?

    μš°μ„ , λŒ€ν™”ν˜• LM에 λŒ€ν•œ μ—°κ΅¬λŠ” λͺ‡ λ…„ μ „ AIκ°€ μˆ˜μ‹­ λ…„ λ§Œμ— λ‹€μ‹œ μœ ν–‰ν•  λ•ŒλΆ€ν„°, AI λΉ„μ„œ, 슀마트 μŠ€ν”Όμ»€, μŒμ„±μΈμ‹ 기술과 ν•¨κ»˜ μœ ν–‰ν–ˆλ˜,

    "챗봇"

    챗봇 μ‹œμŠ€ν…œ 덕뢄에 ν™œλ°œνžˆ μ΄λ£¨μ–΄μ‘Œλ‹€.

    이건 κ°‘μž‘μŠ€λŸ¬μš΄ λ“±μž₯이 μ•„λ‹ˆλΌ 이미 μ˜€λž˜μ „λΆ€ν„° λ‹€μ–‘ν•œ ν˜•νƒœλ‘œ μ—°κ΅¬λ˜κ³ , 개발되고, λŒ€μ€‘λ“€μ—κ²Œλ„ 잘 μ•Œλ €μ§„ μ„œλΉ„μŠ€λ‘œλ„ μ•Œλ €μ Έ μžˆμ—ˆλ‹€.

    λ‹€λ§Œ, "연ꡬ" λ ˆλ²¨μ—μ„œ μ΄λ£¨μ–΄μ§€λ˜ 것듀과 λŒ€μ€‘μ΄ μ ‘ν•˜λŠ” μ‹€μ œ "μ„œλΉ„μŠ€" 레벨의 갭이 λ„ˆλ¬΄ 컸던 것이닀.
    μ•„λ¬΄λž˜λ„, 연ꡬ할 λ•ŒλŠ” λŒ€ν™” μ‹œμŠ€ν…œμ΄ μ‚¬λžŒν•œν…Œ μš•μ„ 해도 κ·Έμ € μž¬λ°Œλ„€~ μ•Ό 이것 봐라~ ν•˜κ³  λ„˜μ–΄κ°€μ§€λ§Œ, μ΄μš©μžλ“€μ€ 눈 λ’€μ§‘νžˆκ³  μ–Έλ‘ μ—μ„œ 마ꡬ λ¬Όμ–΄λœ―κΈ° 쒋은 λŒ€μƒμΌ λΏμ΄λ‹ˆκΉŒ.

    이건 μ•„μ£Ό λ‹¨νŽΈμ μΈ μ˜ˆμ‹œμΌ 뿐이고, μ—¬λŸ¬λͺ¨λ‘œ λŒ€μ€‘μ— κ³΅κ°œν•  μ„œλΉ„μŠ€μ—μ„œλŠ” μ§€μΌœμ•Ό ν•  κ·œμΉ™μ΄λ‚˜, λ„˜μœΌλ©΄ μ ˆλŒ€λ‘œ μ•ˆ λ˜λŠ” 그런 선이 μ‘΄μž¬ν–ˆκ³ , 그둜 μΈν•œ μ„œλΉ„μŠ€λ‚˜ 기업이 받을 타격은 기회 λŒ€λΉ„ λ¦¬μŠ€ν¬κ°€ λ„ˆλ¬΄ 컸던 것이닀.

    μ΄λŸ¬λ‹ˆ, ν˜„μ—…μ— 계신 μ—°κ΅¬μžλ“€λ„ 와 이건 μ’€.. ν•˜λŠ” μ„±λŠ₯이라면, λŒ€μ€‘μ˜ λˆˆμ—” κ°‘μžκΈ° 해리포터가 κ³΅μ€‘μ—μ„œ λΉ—μžλ£¨ 타고 μ§€λ‚˜κ°€λ©΄μ„œ λΆˆκ½ƒλ†€μ΄ λ§ˆλ²•μ΄λΌλ„ λ³΄μ—¬μ£ΌλŠ” κ²ƒμ²˜λŸΌ λ³΄μ΄λŠ” 게 μ•„λ‹κΉŒ.

    μ˜€μ£½ν•˜λ©΄ κ·Έ ꡬ글쑰차 λͺ‡ λ…„ μ „λΆ€ν„° λ§Œλ“€μ–΄λ†“κ³  μ ˆλŒ€ μ„œλΉ„μŠ€ κ³΅κ°œν•˜μ§„ μ•Šλ˜ 건데..

     

    # 그럼 μ™œ ꡬ글이 μ•„λ‹ˆλΌ?

    μ„œλΉ„μŠ€ 리슀크λ₯Ό μ°¨μΉ˜ν•˜λ”λΌλ„, ꡬ글과 λ§ˆμ΄ν¬λ‘œμ†Œν”„νŠΈ(OpenAI μ£Ό νˆ¬μžμ‚¬)의 수읡 ꡬ쑰λ₯Ό 보면 닡이 λ‚˜μ˜¨λ‹€.

    ꡬ글은 온라인 κ΄‘κ³  μˆ˜μž…μ΄ μ£Ό μˆ˜μž…μ΄κ³ , λ§ˆμ΄ν¬λ‘œμ†Œν”„νŠΈλŠ” κ΄‘κ³ κ°€ μ£Όμš” 사업 μ˜μ—­λ„ μ•„λ‹λΏλ”λŸ¬, 검색엔진은 λ”λ”μš±μ΄.. (bing μˆ˜μ€€μ€ 말 μ•ˆ 해도 μœˆλ„ 써본 μ‚¬λžŒμ΄λΌλ©΄ λ‹€ μ•Œν„°..) μ£Όμš” 사업이 μ•„λ‹ˆμ—ˆλ‹€.

    그런데 chatGPT와 같은 λŒ€ν™”ν˜• κ²€μƒ‰μ—”μ§„μ˜ νŠΉμ§•μ€, 기쑴에 μ‚¬λžŒμ΄ κ²€μƒ‰ν•΄μ„œ μ—¬κΈ°μ €κΈ° μ‚¬μ΄νŠΈ 듀락날락 ν•˜λ©° 정보λ₯Ό μ·¨λ“ν•˜κ³  μ‘°ν•©ν•΄μ„œ μ›ν•˜λŠ” 정보λ₯Ό μ–»μ–΄λ‚΄λŠ” 과정을 μ „λΆ€ κ±΄λ„ˆλ›°κ²Œ λ§Œλ“€μ–΄ μ€€λ‹€.

    즉, 온라인 곳곳에 심어져 μžˆλŠ” κ΄‘κ³ λ₯Ό μ „ν˜€ 보지 μ•Šκ³  ν•œ λ²ˆμ— μ›ν•˜λŠ” 정보λ₯Ό 얻을 수 μžˆλŠ” μ‹œμŠ€ν…œμ΄λ‹€.
    ꡬ글이 λŒ€ν™”ν˜• LM μ„œλΉ„μŠ€λ₯Ό κ³΅κ°œν•œλ‹€λŠ” 건 μžμ‹ μ˜ μ£Ό λΉ„μ¦ˆλ‹ˆμŠ€ λ‘œμ§μ— λ°˜ν•˜λŠ” ν–‰μœ„κΈ°μ— μ ˆλŒ€λ‘œ λ¨Όμ € κΈ°μˆ μ„ λ³΄μœ ν•΄λ„ μ„œλΉ„μŠ€ν™” ν•˜μ§€ λͺ»ν•˜λŠ” κ²ƒμ΄μ—ˆλ‹€. λ‹€λ§Œ, μ΄μ œλŠ” λˆ„κ΅°κ°€ λŒ€ν™”ν˜• 검색엔진을 μƒλ‹Ήν•œ μ„±λŠ₯으둜 λŒ€μ€‘μ— 선을 보이고 μ‹œμž₯에 λ›°μ–΄λ“  이상 μ’‹λ“  μ‹«λ“  이 νŒμ— ꡬ글도 λ›°μ–΄λ“€μ–΄μ•Όλ§Œ ν•˜λŠ” 상황이 된 것이닀.

     

    # κ΅­λ‚΄ 기업듀은?

    뭐 μ–Έμ œλ‚˜ 그렇듯이 컴퓨터 곡학 μžμ²΄κ°€, μ•„λ‹ˆ 근본적으둜 컴퓨터 μžμ²΄κ°€, 미ꡭ이 μ’…μ£Όκ΅­(?)이기도 ν•˜κ³ , λ§ˆμ΄ν¬λ‘œμ†Œν”„νŠΈ, μ• ν”Œ, ꡬ글(?) λ“±μ˜ 전톡적인 κ±°λŒ€μžλ³Έ IT 기업듀은 μ „λΆ€ 미ꡭ에 μžˆκΈ°λ„ ν•˜λ‹ˆ λ‹Ήμ—°ν•˜κ² μ§€λ§Œ, ν•œκ΅­μ€ 항상 μ–΄λ–€ 기술이 μƒμš©ν™”λ˜λ©΄ ν•œκ΅­μ–΄ 패치만 μ‹œμΌœμ„œ μ‹œμž₯에 내놓곀 ν•΄μ™”λ‹€.

    μ΄λ²ˆμ—λ„ 그럴 것인가?라고 봀을 λ•Œ, μ•„λ§ˆλ„ κ·Έλ ‡κ² μ§€λ§Œ, κΌ­ κ·Έλ ‡μ§€λ§Œμ€ μ•Šμ„μ§€λ„ λͺ¨λ₯΄κ² λ‹€.

    μ•„λ¬΄λž˜λ„ μ‘΄μž¬ν•˜λŠ” λͺ¨λ“  ν…μŠ€νŠΈ 데이터 μžμ²΄κ°€ ν•œκ΅­μ–΄λŠ” 영문 λ°μ΄ν„°λ§ŒνΌ λ§Žμ§€ μ•Šλ‹€. μ–Έμ–΄ μ‚¬μš©μΈκ΅¬λ‘œ λ³΄λ‚˜, λ‹€μ–‘μ„±μœΌλ‘œ λ³΄λ‚˜.. μ „ 세계 λ‹€μ–‘ν•œ κ΅­κ°€μ˜ 15μ–΅ λͺ…이 μ‚¬μš©ν•˜λŠ” 언어보닀 λ§Žμ„ μˆ˜λŠ” μ—†λ‹€. 10μ–΅ 인ꡬ의 쀑ꡭ어쑰차도 쀑ꡭ인 μ™Έμ—” 거의 μ“°μ§ˆ μ•ŠμœΌλ‹ˆ.

    κ·Έλž˜λ„ chatGPTλ₯Ό ν•™μŠ΅ν•  만큼의 raw λ°μ΄ν„°λŠ” ν•œκ΅­μ–΄λ„ λͺ¨μœΌλ©΄ μΆ©λΆ„νžˆ μžˆμ„ 것이닀. (175B νŒŒλΌλ―Έν„° LLM κΈ°μ€€) 그럼 PPO κ°•ν™”ν•™μŠ΅μ„ μœ„ν•œ λ°μ΄ν„°λŠ” μ΄μ œλΆ€ν„°λΌλ„ νˆ¬μžν•΄μ„œ ꡬ좕해야 ν•  데이터고 이건 μ‹œκ°„μ΄ μ§€λ‚˜λ©΄ 생겨날 ν…Œκ³ .

    그럼 뭐가 문제일까? 

    μˆ˜μ΅μ„±

    데이터와, "κ°€λŠ₯μ„±"만 놓고 봀을 λ•ŒλŠ” κ°€λŠ₯은 ν•˜μ§€λ§Œ, 기업은 μ΄μœ€μ„ 좔ꡬ해야 ν•œλ‹€. μˆ˜μ΅μ„ λ‚΄λŠ” μ§‘λ‹¨μ΄λΌλŠ” 것인데, chatGPTλ₯Ό κ°œλ°œν•˜κ³ , ν•™μŠ΅ν•˜κ³ , μ„œλΉ„μŠ€ μš΄μ˜ν•˜λŠ”λ° λ“œλŠ” λ§‰λŒ€ν•œ λΉ„μš©μ— λŒ€ν•΄μ„œλŠ” μ–΄μ°Œν•  건가? λΉ„μš© νš¨μœ¨μ„ 따져봀을 λ•Œ κ΅­λ‚΄μ—μ„œλŠ” 이런 κ±Έ κ³Όκ°ν•˜κ²Œ μ‹œλ„ν•  수 μžˆλŠ” 자본λ ₯의 기업이 μ—†λ‹€. μ‚Όμ„±? 넀이버? 카카였? (음.. μ–˜λ„€λŠ” 빼자, ν˜„κΈˆμ΄ 그리 λ§Žμ§€ μ•Šμ€ 고평가 κΈ°μ—…μ΄λ‹ˆ^^) ν˜„κΈˆ κ½€λ‚˜ λ§Žλ‹€λŠ” 기업듀도 고민슀러울 μˆ˜λ°–μ— μ—†λŠ” 게, λ§Œλ“€μ–΄ 놓고도 μˆ˜μ΅ν™”ν•˜μ§€ λͺ»ν•  기술이라면 νˆ¬μžκ°€ μ‰¬μš΄ 결정이 아닐 ν…Œλ‹ˆ 말이닀.

    베타 μ„œλΉ„μŠ€ μˆ˜μ€€λ§ŒμœΌλ‘œ λ³Ό λ•ŒλŠ” μƒλ‹Ήνžˆ κ·ΈλŸ΄λ“―ν•œ μ„±λŠ₯에, μƒλ‹Ήνžˆ ν₯미둜운 κΈ°μ‘΄μ—λŠ” μ—†λ˜ μ„œλΉ„μŠ€κ°€ μ‚¬λžŒλ“€ λˆˆμ—λŠ” μ‹ κΈ°ν•˜κΈ°λ§Œ ν•  λΏμ΄μ§€λ§Œ, κ³Όμ—° 정말 chatGPT둜 μ•„μ£Ό μ€‘μš”ν•œ λ¬Έμ„œ μž‘μ„±, 업무 μˆ˜ν–‰μ— μ˜¨μ „νžˆ 맑길 수 μžˆκ² λƒ ν•˜λ©΄, λ§μ„€μ—¬μ§ˆ 것이닀. λ¬Έμž₯의 λ‚΄μš©μ΄ 그럴 듯은 ν•˜μ§€λ§Œ, μžμ„Ένžˆ 읽어보면 ν‹€λ¦° 말도 있고 논리적 였λ₯˜λ„ 있고, 질문과 μƒκ΄€μ—†λŠ” 이야길 ν•˜κΈ°λ„ ν•œλ‹€.

    κ·Έλ ‡λ‹€κ³  아무짝에 μ“Έλͺ¨μ—†λŠ” 것은 μ•„λ‹ˆλ‹€. 자율 μ£Όν–‰ μ°¨λŸ‰μ„ 보면, λΆ„λͺ… λ‚΄κ°€ ν•Έλ“€κ³Ό νŽ˜λ‹¬μ—μ„œ μ†λ°œ λ–Όκ³  눈 뢙일 수 μžˆλŠ” 건 μ•„λ‹ˆμ§€λ§Œ, λ°˜μžλ™μœΌλ‘œ 보쑰만 ν•΄μ€˜λ„ λ‚˜μ˜ ν”Όλ‘œλ„κ°€ ν™• μ€„μ–΄λ“œλ‹ˆ 말이닀.

    chatGPTλŠ” μžμœ¨μ£Όν–‰ μ°¨λŸ‰μ΄λž‘ 근본적으둜 λ‹€λ₯Έ 뢀뢄이 μžˆλ‹€. μžλ™μ°¨λŠ”, 특히 κ³ -κΈ‰ μžλ™μ°¨λŠ” 이미 μ‚¬λžŒλ“€μ΄ μƒλ‹Ήν•œ κ±°κΈˆμ„ λ“€μ—¬ κ΅¬λ§€ν•˜λŠ” 것을 μžμ—°μŠ€λŸ½κ²Œ 받아듀이기 λ•Œλ¬Έμ— 이런 μžμœ¨μ£Όν–‰ κΈ°μˆ μ€ κ°’ λΉ„μ‹Ό μ œν’ˆμ— λ„£μ–΄μ„œ νŒ”κΈ°λ§Œ ν•˜λ©΄ λ°”λ‘œ μˆ˜μ΅ν™”κ°€ λœλ‹€. ν•˜μ§€λ§Œ, chatGPTλ₯Ό μ–΄λ–»κ²Œ μƒν’ˆν™”ν•΄μ„œ νŒ”μ•„μ•Ό 수읡이 λ‚ κΉŒ? ν˜„μž¬μ²˜λŸΌ λ‹¨μˆœνžˆ 유료 API둜 사업을 ν•˜λ©΄, κ³„μ†ν•΄μ„œ 적자만 λ°œμƒν•œλ‹€. MSλŠ” 이걸 κ·Έλž˜μ„œ μžμ‚¬ 검색 엔진인 Bing에 λ„£μ–΄μ„œ κ΅¬κΈ€μ˜ 검색 μ‹œμž₯을 양뢄화해보렀고 ν•˜λŠ” λ“―ν•˜λ‹€. λ¬Όλ‘ .. κ΅¬κΈ€μ˜ μˆ˜μ΅μ€ κ²€μƒ‰μ—”μ§„μ—μ„œ μ˜€λŠ” 것이 μ•„λ‹ˆλΌ 검색을 μœ„ν•΄ μ‚¬λžŒλ“€μ΄ 이 νŽ˜μ΄μ§€ μ € νŽ˜μ΄μ§€ λ„˜λ‚˜λ“€λ©° λ³΄λŠ” κ΄‘κ³ λ“€λ‘œλΆ€ν„° μ˜€λŠ” κ²ƒμ΄μ§€λ§Œ.. Bing을 톡해 μ–΄λ–»κ²Œ μˆ˜μ΅ν™”ν• μ§€λŠ” 아직 μ§€μΌœλ΄μ•Ό ν•  λΆ€λΆ„ κ°™λ‹€.

    이 μˆ˜μ΅μ„±μ΄λΌλŠ” μ€‘μš”ν•œ μ§ˆλ¬Έμ— μ˜λ¬Έμ„ 가진 μ±„λ‘œλŠ” μ•„λ§ˆ λ‹€μ‹œ κ³Όκ±° 5λ…„ μ „μœΌλ‘œ λŒμ•„κ°€μ„œ chatGPT에 λŒ€ν•΄ κ΅­λ‚΄ κΈ°μ—… μ΄μˆ˜λ“€μ—κ²Œ μ•Œλ €μ€˜λ„ 뛰어듀진 μ•Šμ•˜μ„μ§€λ„?

    λ°˜μ‘ν˜•

    'ML engineer > NLP' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

    [02] Korean Language Model - 데이터 μ „μ²˜λ¦¬  (1) 2023.02.04
    Transformer Encoder  (0) 2022.12.31
    [01] Korean Language Model - 데이터 μˆ˜μ§‘  (1) 2022.12.31

    λŒ“κΈ€

Designed by naubull2.