OpenAI 대 Google: Gemini, 라이벌 ChatGPT의 음성 모드에 대한 라이브 롤 출시 – 새로운 도전 등장

작성자: C, Fiona

마지막 업테이트: 2024-08-14

BTCC를 선택하는 이유

암호화폐 부문의 프로 플레이어인 BTCC는 10년 이상의 플랫폼 운영으로 업계 경험을 통해 탄탄한 신뢰 기반이 구축되어 있습니다. BTCC는 예리한 시장 통찰력과 깊은 블록체인 기술 이해를 활용하여 유저에게 정확한 시장 분석과 투자 전략을 제공하는 프로 전문 분석가 팀을 보유하고 있습니다. 또한 BTCC는 엄격한 편집 기준을 준수하여 모든 기사와 분석이 사실에 기반하고 객관적이고 공정하도록 노력하며 투자자에게 신뢰할 수 있는 통찰력을 제공합니다. 빠르게 변화하는 암호화폐 시장에서 BTCC는 안정성, 전문성, 미래 지향적 접근 방식으로 인해 수많은 투자자와 애호가에게 없어서는 안 될 파트너 일 것 입니다.

OpenAI 대 Google: Gemini, 라이벌 ChatGPT의 음성 모드에 대한 라이브 롤 출시 - 새로운 도전 등장

OpenAI 대 Google: 거대 기술 기업인 OpenAI는 OpenAI의 새로운 ChatGPT용 고급 음성 모드와 경쟁하기 위해 AI 비서 Gemini의 음성 채팅 기능인 Gemini Live를 공개했습니다. 2024년 Made by Google 이벤트에서 공개된 이 혁신적인 기능은 고급 패키지 사용자에게 제공되어 AI 기술을 통한 원활한 음성 상호 작용 경험을 약속합니다. Google과 OpenAI 간의 AI 경쟁에서 이 흥미로운 발전에 대한 추가 업데이트를 계속 지켜봐 주시기 바랍니다.

OpenAI 대 Google: Gemini Live가 ChatGPT의 음성 모드에 도전할 수 있나요?
AI 상호작용을 어떻게 향상할 수 있나요?
OpenAI는 고급 음성 모드를 통해 문제를 어떻게 해결하고 있나요?

OpenAI 대 Google: Gemini Live가 ChatGPT의 음성 모드에 도전할 수 있나요?

X 스레드에서 회사는 OpenAI가 최근 공개한 ChatGPT용 고급 음성 모드와 경쟁하기 위한 Gemini Live의 출시를 발표했습니다. 2024년 이벤트에서 공개된 이 새로운 기능은 이제 Gemini Advanced 사용자가 액세스할 수 있어 보다 자연스럽고 유연한 접근 방식으로 AI 상호 작용을 향상시킵니다. 사용자는 전화 통화의 자발성을 반영하여 자유롭게 대화를 중단하고, 주제를 전환하거나, 대화를 계속할 수 있습니다. Gemini Live는 Google이 일관되고 감성적이며 자연스럽게 흐르는 다단계 대화를 제공한다고 선전하는 새로운 음성 엔진으로 돋보입니다. 10가지 자연스러운 음성을 제공하며 사용자의 음성을 실시간으로 모방하는 기능까지 갖추고 있어 AI 경험을 새로운 차원으로 끌어올립니다. 게다가 이 핸즈프리 모드는 백그라운드에서나 휴대폰이 잠겨 있을 때에도 원활하게 작동하여 사용자가 멀티태스킹을 하는 동안에도 중단 없이 대화할 수 있습니다. Gemini Live를 통해 회사는 AI 경쟁에서 중요한 진전을 이루며 OpenAI와 같은 경쟁에 도전하고 음성 기반 AI 상호 작용의 미래를 형성합니다. .

AI 상호작용을 어떻게 향상할 수 있나요?

결과적으로 AI 어시스턴트의 Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다른 생성 AI 모델에 비해 더 긴 컨텍스트 창 덕분에 확장되고 복잡한 대화를 촉진합니다. 이러한 발전을 통해 Gemini Live는 데이터를 보다 효율적으로 저장하는 동시에 더 긴 토론에 참여할 수 있습니다. 또한 회사는 Google I/O 2024에서 처음 선보인 다중 모드 입력이 연말까지 Gemini Live에 통합되어 음성 명령 이상으로 확장될 것이라고 발표했습니다. 이러한 통합을 통해 AI의 이해력과 이미지, 비디오 등의 시각적 신호에 대한 반응성이 향상되어 적응성이 더욱 향상됩니다. 현재 이 업그레이드는 영어를 사용하는 Android 사용자에게만 제공되지만 추가 언어 및 iOS 장치에 대한 지원도 곧 제공될 예정입니다.

회사는 최신 기능을 선보이면서 추가 통합과 발전을 준비하고 있습니다. 앞으로 몇 주 안에 Gemini는 캘린더, Keep, Tasks, YouTube Music 등 Google 앱과 호환되는 새로운 확장 프로그램을 받을 예정입니다. 이러한 통합을 통해 사용자의 일상이 간소화되어 간단한 음성 명령을 통해 재생 목록, 미리 알림 및 일정을 효율적으로 관리할 수 있습니다. 또한 Android 사용자는 곧 전원 버튼이나 음성 안내를 통해 모든 애플리케이션에서 Gemini를 활성화할 수 있게 됩니다. 이 혁신적인 기능을 통해 사용자는 다양한 애플리케이션에서 Gemini에 참여하고 질문을 제기하거나 작업 흐름에 원활하게 혼합되는 이미지와 같은 콘텐츠를 생성할 수 있습니다.

OpenAI는 고급 음성 모드를 통해 문제를 어떻게 해결하고 있나요?

진행 중인 OpenAI 대 Google 경쟁에서 Google의 ChatGPT용 고급 음성 모드 도입은 초기 알파 테스트 단계에서 몇 가지 문제에 직면했습니다. 이 모드는 보다 실감나는 대화 상호 작용을 제공하여 사용자 경험을 향상시키는 것을 목표로 하지만, 매우 현실적인 음성 교환으로 인해 AI에 대한 과도한 의존도를 조장할 가능성이 있다는 비판을 불러일으켰습니다. 최근 OpenAI는 사용자와 AI 사이의 사회적 유대감의 출현과 관련해 안전 문제를 제기했는데, 이는 잠재적으로 인간 대 인간 관계에 해를 끼칠 수 있습니다. 이러한 문제를 해결하고 AI 역량을 더욱 개선하기 위해 회사는 AI 모델의 소프트웨어 엔지니어링 숙련도를 강화하는 방법을 적극적으로 모색해 왔습니다. 이러한 노력의 일환으로 OpenAI는 AI 모델이 실제 소프트웨어 문제를 얼마나 잘 처리할 수 있는지에 대한 보다 정확한 평가를 제공하도록 설계된 SWE 벤치 벤치마크의 인간 평가 하위 세트를 출시했습니다. 이번 최신 개발은 AI의 발전이 일상적인 사용에서 안전하고 실용적으로 유지되도록 보장하려는 지속적인 노력을 나타냅니다.