최근 수정 시각 : 2024-08-12 16:10:12

Udio


생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · o1 · LLaMA · Gemma · Claude · Phi · Exaone
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 모델 기반
대화형
+이미지
Exaone 2.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini
+에이전트
Claude 3.5 Sonnet
행위/동작 [[지능형 에이전트|
에이전트
]] Apple Intelligence · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

Udio
유디오
파일:Udio 아이콘.svg
<colbgcolor=#e30b5d><colcolor=#fff> 출시일
베타
2024년 4월 10일
기능 음악 인공지능
지원 언어 한국어[1], 영어, 중국어, 일본어, 러시아어, 폴란드어, 독일어, 프랑스어, 이탈리아어
사용처 자체 웹앱
라이선스 Proprietary SW
링크 파일:홈페이지 아이콘.svg | 파일:디스코드 아이콘.svg | 파일:X Corp 아이콘(블랙).svg | 파일:인스타그램 아이콘.svg | 파일:틱톡 아이콘.svg | 파일:레딧 아이콘.svg

1. 개요2. 특징3. 구조4. 평가5. 반응6. 기타7. 관련 문서

[clearfix]

1. 개요

구글 딥마인드 출신 공학자들이 만든 오디오 및 음악 생성 인공지능. 간단한 프롬프트로 음악을 생성할 수 있다.

2. 특징

  • 현재 사용자 급증으로 인한 서버 과부하 이슈를 겪고 있기는 하지만, 사람이 없는 시간대에는 40초만에 30초짜리 곡 2개를 금방 만들어낼 수 있다. 또한 곡 확장 기능을 이용해 곡의 길이를 더 늘릴 수도 있다.
  • 음악 생성 인공지능 중에서는 굉장히 높은 퀄리티를 자랑한다.

3. 구조

구체적으로는 두 단계로 작업을 처리한다.
먼저 대형 언어 모델을 사용해 프롬프트를 기반으로 가사를 생성한다.
그 다음 Stability AI Stable Audio와 유사한 확산 모델(Diffusion)을 사용하여 음악을 생성한다. #

4. 평가

  • 음질
    • 전체적인 음질이 매우 깔끔하며, AI가 생성한 듯한 느낌이 들지 않을 때도 많다. 또한 Suno에 비해 보컬 갈라짐 현상도 매우 적은 편이다.
  • 곡 구성
    • 곡의 전개나 흐름이 전혀 이상하지 않고 자연스럽다. 구글의 Music fx와 같은 모델은 음악의 흐름이 중구난방인데에 비해 Udio는 곡의 흐름이 납득이 갈 정도로 자연스럽다는 것을 느낄 수 있다.

5. 반응

  • 윌아이엠은 “이것은 완전히 새로운 르네상스이며, 유디오는 이 시대의 창의성을 위한 도구다”라며 “유디오를 사용하면 AI와 상상력을 통해 노래를 존재하게 만들 수 있다”라고 극찬했다. #
  • 레딧에는 "완전히 미쳤다" “정말 섬칫할 정도다” “이것이 무섭다고 생각하지 않는다면 당신은 자신에게 거짓말을 하고 있는 것” “작곡가에게는 죽음을 알리는 종소리” 등 놀라워하는 반응이 많다.

6. 기타

  • 자동 저작권 필터를 갖추고 있다.

7. 관련 문서


[1] 공식 사이트에는 한국어 지원에 대한 내용이 없지만, 한국어 가사로도 무난하게 곡 생성이 가능하다.