발견 오디박스, Meta의 AI는 인상적인 방식으로 음성을 복제합니다. 사실, 최근 몇 달 동안 우리는 흥미로운 도구를 많이 보았습니다. 인공지능을 기반으로, 나는 우리가 계속 보게 될 것이라고 확신합니다.
Facebook, Instagram, WhatsApp 등의 모회사인 Meta는 새로운 기능 개발에 주력해 왔습니다. 처음에 그의 프로젝트는 최고의 성공을 거두지 못한 메타버스, 이제 그들은 인공 지능에 중점을 둡니다. 이는 달성할 수 있는 기능 중 하나일 뿐입니다.
에 대해 조금 더 알고 싶으시다면 음성 복제를 위한 Meta의 AI인 Audiobox, 그렇다면 이 메모가 마음에 드실 겁니다. 확실히 이 도구는 계속해서 비약적으로 발전할 것이며, 이로 인해 이 노트를 곧 업데이트하게 될 것입니다.
오디오박스란 무엇인가요?
다음과 같이 말할 수 있습니다. 소리는 삶의 중요한 부분입니다 단순한 소리를 훨씬 뛰어넘는 사람들의 소리. 이를 바탕으로 Meta는 청각 스펙트럼의 일부인 음악, 소리, 음성 및 기타 요소를 분해하여 대규모 오디오를 완전히 개발하는 데 중점을 두었습니다.
온라인 디지털 도구인 Audiobox는 다양한 청각 수준을 모방하고, 연구하고, 처리하려고 합니다.. 가장 주목할만한 측면 중 하나는 디지털 방식으로 훌륭한 방식으로 작동하는 요소인 목소리의 모방입니다. 현재 이 도구는 데모로 작동하지만 시험해 볼 수 있습니다.
그 동작은 매우 일반적인 방식으로, 단순한 목소리를 뛰어넘는 모델 개발을 기반으로 합니다., 생성되는 환경도 관리하기 때문입니다. 이러한 모델에는 사용자 지원이 필요하며, 무거운 작업은 인공 지능 엔진에 맡겨집니다.
음성 생성에 관해서는, 오디오로 방송될 내용의 전사가 필요합니다.. 또한, 이를 통해 인공지능 프로세서를 훈련시켜 더 큰 유사성을 제공할 수 있습니다.
매우 개방적인 방식으로 이 도구는 다양한 환경에서 다양한 목소리를 에뮬레이트할 수 있습니다., 인공 지능을 통해 모두. 아이디어는 AI의 심층 작업을 활용하여 미래에 새로운 청각 기능을 구현하는 것입니다.
어떤 내용인지 직접 알고 싶다면, 당신은 그의 논문을 방문할 수 있습니다 다음 링크에서. 아쉽게도 모든 내용은 영어로 되어 있지만 웹 번역기의 지원을 받아 읽을 수 있습니다.
Audiobox를 사용하여 음성을 복제하는 방법
시작하기 전에 음성 복제가 무엇인지 이해하는 것이 중요합니다. 진실은 당신이 상상하는 것, 그 과정은 음성으로 오디오를 재생하지만 발음하지 않은 단어로 오디오를 재생합니다..
이는 음성 톤, 단어 강세 등을 얻은 후 나중에 텍스트 생성기의 도움을 받아 말하고 싶은 내용을 입력하는 것을 기반으로 합니다. 아마도 이는 위조 및 사기 문제와 관련하여 향후 문제가 될 수 있지만 Meta는 이미 이러한 요소를 고려하고 있습니다.
Audiobox를 사용하여 음성을 복제하는 단계별 방법
이것은 여러분이 찾을 수 있는 많은 기능 중 하나일 뿐이지만, 어딘가에서 시작해야 합니다. 음성을 복제하기 위해 따라야 하는 프로세스는 다음과 같습니다.
- 의 웹사이트를 입력하세요. 오디오박스.
- 웹사이트 상단 섹션에서는 이번 행사에 관심을 가질 만한 다양한 옵션을 찾을 수 있습니다. "기능". 그것을 클릭하십시오.
- 서비스 약관에 동의하세요.
- 옵션 선택 "너의 목소리”는 정기적으로 사전 정의됩니다.
- 첫 번째 단계는 음성 샘플을 얻는 것입니다. 이렇게 하려면 음성 녹음 옵션이 나타날 때까지 동일한 페이지로 이동한 다음 복제할 텍스트를 선택하세요.
- 아래에 표시되는 단락을 읽는 목소리를 녹음하세요.
- 녹음을 수락한 후 복제할 텍스트를 작성합니다.
- 버튼을 누르십시오 "생성".
- 몇 초 정도 기다린 후 플랫폼에 두 가지 재생 옵션이 표시됩니다.
- 결과에 동의한다면, 마음에 들면 엄지손가락을 치켜세우고, 좋지 않으면 엄지손가락을 내리면 AI가 학습하도록 도울 수 있습니다.
- 결과를 다운로드하세요. 이렇게 하려면 아래쪽 화살표가 있는 버튼을 클릭하세요. 오디오 오른쪽에서 찾을 수 있습니다.
데모이므로 매우 중요한 요소를 명심하세요. 상상할 수 있듯이 입력 및 출력 언어는 영어 하나만 있습니다.. 곧 스페인어가 포함된 국제 버전이 나올 수 있기를 바랍니다.
또 다른 흥미로운 Audiobox 도구
음성 복제 외에도 Audiobox에는 정말 놀라운 결과를 얻을 수 있는 다른 흥미로운 도구가 있습니다. 무엇을 할 수 있는지에 대한 명확한 예는 "옵션에서 찾을 수 있습니다.오디오박스 메이커".
몇 가지 예가 있습니다. 그들은 짧은 이야기를 한다, 음향 효과가 있습니다. 흥미로운 점은 오디오 생성, 음향 효과, 심지어 믹싱까지 모두 포털에서 수행된다는 것입니다.
기능 옵션 중에서 오디오 생성을 위한 다음 옵션을 볼 수 있습니다.
- 너의 목소리: 귀하의 음성으로 번역되어 귀하의 음성을 복제하고 작성된 콘텐츠에서 오디오를 생성하는 데 사용됩니다. 이전에 사용했던 모듈입니다.
- 설명된 음성: 오디오 소설을 생성하고 콘텐츠를 입력하고 화자의 목소리를 원하는 대로 입력할 수 있습니다. 소셜 네트워크에서 이야기를 나누는 데 탁월한 옵션입니다.
- 스타일이 변경된 음색: 녹음된 음성을 기반으로 콘텐츠를 생성하여 새로운 청취 스타일을 제공하고 억양, 강조 또는 일시 중지를 변경할 수 있습니다.
- 음향 효과: 서면 설명이나 주문에 따라 음향 효과를 생성할 수 있습니다. 오디오노벨라를 위한 완벽한 보완책입니다.
이전에 녹음된 오디오를 편집할 수 있는 다른 흥미로운 옵션이 있습니다. 아래에서 보여드리겠습니다.
- 마법 지우개: 녹음 시 노이즈를 제거할 수 있습니다. 깨끗하고 선명한 오디오를 전송하려는 사람들에게 이상적입니다.
- 소리 채우기: 오디오 내에서 사운드의 일부를 제거하고 삽입할 수 있습니다.
보다시피, Audiobox는 음성을 복제하는 도구 그 이상입니다. 우리는 오디오, 편집, 창작에만 100% 전념하는 인공지능 플랫폼을 마주하고 있다고 단언할 수 있습니다.
지금은 데모만 보고 있습니다. 메타그룹이 계속해서 개발 중 그리고 독특한 작품을 만드는 것. 현재 우리는 스페인어 버전을 기다리고 있습니다.
궁금한 점이 있으면 댓글에 남겨주시면 됩니다. 아직 개발할 부분이 많습니다. 다음 기회에 서로 읽어보겠습니다.