Skip to content
Home » Tech » Google เปิดตัวแอปถอดเสียง AI ใหม่ “AI Edge Eloquent” ชูจุดเด่นประมวลผลบนเครื่อง

Google เปิดตัวแอปถอดเสียง AI ใหม่ “AI Edge Eloquent” ชูจุดเด่นประมวลผลบนเครื่อง

Google AI

Google สร้างความเคลื่อนไหวอีกครั้งในวงการ AI ด้วยการเปิดตัวบริการใหม่ล่าสุดในรูปแบบแอปพลิเคชันถอดเสียงแบบออฟไลน์สำหรับ iPhone โดยใช้ชื่อว่า “Google AI Edge Eloquent” แอปนี้โดดเด่นด้วยสถาปัตยกรรม Gemma ของ Google และความสามารถในการประมวลผลบนตัวเครื่อง แต่ในขณะเดียวกันก็นำมาซึ่งข้อถกเถียงเรื่องนโยบายความเป็นส่วนตัวที่ดูจะขัดแย้งกับคุณสมบัติหลักที่โฆษณาไว้

Google AI Edge Eloquent: แอปถอดเสียงอัจฉริยะจาก Google

แทนที่จะรวมฟังก์ชันนี้เข้ากับแอป Gemini ที่มีอยู่แล้ว Google กลับเลือกที่จะเปิดตัว “Google AI Edge Eloquent” เป็นแอปพลิเคชันแยกต่างหากบน iPhone ซึ่งเป็นโปรแกรมถอดเสียงที่ออกแบบมาเพื่อทำงานแบบออฟไลน์เป็นหลัก หลังจากการติดตั้งและตั้งค่าเบื้องต้นที่ไม่ซับซ้อน ผู้ใช้จะถูกขอให้บันทึกประโยคตัวอย่างเพื่อการปรับจูน

แอปนี้มีโหมดการทำงานหลักสองแบบ:

  • On-device mode (โหมดประมวลผลบนเครื่อง): เป็นโหมดการทำงานแบบออฟไลน์เต็มรูปแบบ ข้อมูลเสียงและการสนทนาทั้งหมดจะถูกจัดเก็บไว้บนอุปกรณ์ของคุณเท่านั้น ไม่มีการส่งข้อมูลออกนอกเครื่อง
  • Enhanced text polishing (โหมดปรับปรุงข้อความ): ในโหมดนี้ ไฟล์เสียงยังคงอยู่บนอุปกรณ์ของคุณ แต่จะใช้ Gemini ในการ “ขัดเกลา” ข้อความที่ถอดเสียงให้สมบูรณ์ยิ่งขึ้น ซึ่งหมายความว่าข้อมูลบางส่วนจะต้องถูกส่งไปยังระบบคลาวด์เพื่อการประมวลผล

จากการทดสอบเบื้องต้นพบว่าแอปมักจะเปิดในโหมด “Enhanced text polishing” เป็นค่าเริ่มต้น แต่ผู้ใช้สามารถสลับไปใช้ “On-device mode” ได้อย่างง่ายดายด้วยการแตะปุ่มสลับที่มุมขวาบนของหน้าจอหลัก นอกจากนี้ แอปยังมีความสามารถในการลบคำฟุ่มเฟือย (filler words) เช่น “เอ่อ” หรือ “อืม” ออกจากข้อความถอดเสียงโดยอัตโนมัติ

ประเด็นความเป็นส่วนตัวที่ยังคงเป็นคำถาม

แม้ว่า Google จะโฆษณาว่า “ข้อมูลเสียง การสนทนาที่เป็นความลับ และข้อมูลส่วนตัวจะไม่ถูกส่งออกจากอุปกรณ์ของคุณ” แต่รายละเอียดในนโยบายความเป็นส่วนตัวกลับสร้างความกังวลอย่างมาก นโยบายระบุว่า Google สามารถเชื่อมโยงข้อมูลหลายประเภทกับตัวผู้ใช้ได้ ซึ่งรวมถึงตำแหน่งที่ตั้ง รายชื่อติดต่อ รหัสระบุตัวตน ข้อมูลการวินิจฉัยอุปกรณ์ ข้อมูลติดต่อ เนื้อหาที่ผู้ใช้สร้างขึ้น ข้อมูลการใช้งาน และข้อมูล “อื่นๆ” นอกจากนี้ยังมีการเก็บข้อมูลการซื้อและข้อมูลการวินิจฉัยอื่นๆ โดยไม่เชื่อมโยงกับตัวตนของผู้ใช้

ข้อมูลจำนวนมหาศาลนี้ทำให้เกิดคำถามถึงความโปร่งใสและขอบเขตของการประมวลผลข้อมูล โดยเฉพาะเมื่อโหมด “Enhanced text polishing” มีการส่งข้อมูลไปยังคลาวด์ ซึ่งอาจเป็นจุดที่ข้อมูลเหล่านี้ถูกเก็บรวบรวม ผู้ใช้งานจึงควรพิจารณาให้ดีก่อนตัดสินใจใช้งานโหมดนี้ หากกังวลเรื่องความเป็นส่วนตัว ทาง Google เองยังไม่ได้ให้คำชี้แจงเพิ่มเติมในประเด็นนี้

ประสิทธิภาพและฟีเจอร์เด่นที่น่าสนใจ

ในการทดสอบเบื้องต้น พบว่าแอป “Google AI Edge Eloquent” มีประสิทธิภาพที่น่าประทับใจ แม้จะมีปัญหาเล็กน้อยในการเริ่มใช้งานครั้งแรกที่ต้องมีการจับคู่และเลิกจับคู่ AirPods กับ iPhone เพื่อให้แอปทำงานได้ แต่เมื่อใช้งานได้แล้ว การถอดเสียงมีความแม่นยำเกือบสมบูรณ์ โดยแอปสามารถแก้ไขคำที่ถอดผิดให้ถูกต้องได้เองเมื่อมีบริบทเพิ่มเติมเข้ามา

นอกจากการถอดเสียงที่แม่นยำแล้ว แอปยังมีฟีเจอร์อื่นๆ ที่ช่วยเสริมการใช้งาน:

  • การแก้ไขข้อความด้วยตนเอง: ผู้ใช้สามารถแตะไอคอนรูปดินสอเพื่อแก้ไขข้อความที่ถอดเสียงได้ด้วยตัวเอง หาก AI ถอดเสียงผิดพลาด
  • สถิติการใช้งาน: สามารถดูสถิติต่างๆ เช่น จำนวนคำที่พูด จำนวนคำต่อนาที และจำนวนการแก้ไขที่ AI ทำ
  • เครื่องมือแก้ไข AI เพิ่มเติม (สำหรับโหมด Gemini): หากเปิดใช้งาน Gemini ผู้ใช้จะเข้าถึงเครื่องมือ AI ขั้นสูงเพิ่มเติม เช่น “Key Points” (สรุปประเด็นสำคัญ), “Formal” (ปรับเป็นทางการ), “Short” (ย่อ), และ “Long” (ขยายความ)
  • คัดลอกข้อความ: เมื่อพอใจกับการถอดเสียง สามารถคัดลอกข้อความไปยังคลิปบอร์ดเพื่อนำไปใช้งานต่อได้ทันที
  • ประวัติและพจนานุกรมส่วนตัว: แท็บ “History” ให้ผู้ใช้กลับไปดูและแก้ไขการถอดเสียงครั้งก่อนๆ ส่วนแท็บ “Dictionaries” ช่วยให้เพิ่มคำศัพท์เฉพาะทางที่ AI อาจไม่รู้จัก เพื่อเพิ่มความแม่นยำในการถอดเสียงในอนาคต

มุมมองจากบรรณาธิการ: Google AI Edge Eloquent น่าใช้แค่ไหน?

จากภาพรวมของแอป Google AI Edge Eloquent เรามองว่านี่คืออีกก้าวที่น่าสนใจของ Google ในการนำ AI มาใช้ในชีวิตประจำวัน โดยเฉพาะอย่างยิ่งฟีเจอร์การประมวลผลบนเครื่อง (On-device mode) ที่ให้ความสำคัญกับความเป็นส่วนตัว ซึ่งเป็นจุดแข็งที่ทำให้แอปนี้โดดเด่นกว่าเครื่องมือถอดเสียงอื่นๆ หรือแม้แต่ฟังก์ชันถอดเสียงใน iOS เอง หาก Google สามารถให้ความชัดเจนเกี่ยวกับนโยบายความเป็นส่วนตัวและพิสูจน์ได้ว่าในโหมดออฟไลน์นั้นข้อมูลส่วนตัวจะไม่รั่วไหลไปไหนจริง ๆ แอปนี้ก็มีศักยภาพที่จะกลายเป็นเครื่องมือสำคัญสำหรับผู้ที่ต้องถอดเสียงบ่อย ๆ ไม่ว่าจะเป็นนักศึกษา นักข่าว หรือผู้ใช้งานทั่วไปที่ต้องการความแม่นยำและความเป็นส่วนตัว

ส่วนตัวแล้ว หากความแม่นยำและความเร็วในการทำงานเหนือกว่าฟังก์ชันที่มาพร้อมกับ iOS อย่างชัดเจน และประเด็นเรื่องความเป็นส่วนตัวได้รับการแก้ไขอย่างโปร่งใส เราก็พร้อมที่จะพิจารณาใช้ Google AI Edge Eloquent เป็นทางเลือกหลัก อย่างไรก็ตาม การตัดสินใจเลือกใช้งานคงต้องขึ้นอยู่กับความสำคัญของความเป็นส่วนตัวสำหรับแต่ละบุคคล และการรอคำชี้แจงเพิ่มเติมจาก Google ในอนาคต

ที่มา: lifehacker.com

ข่าวที่เกี่ยวข้อง

BangkokStyle

ผู้หลงใหลในจังหวะชีวิตของชาวกรุงเทพฯ ปัณณพัทธ์ โกษาแสง (@krapalm) บล็อกเกอร์ที่นำเสนอเรื่องราวการผสมผสานระหว่างเทคโนโลยีล้ำสมัย แฟชั่น ความงาม และไลฟ์สไตล์คนเมืองเข้าไว้ด้วยกันอย่างลงตัว นอกเหนือจากการคอยอัปเดตเทรนด์ไอทีที่ digitalmore.co แล้ว ผมตั้งใจใช้พื้นที่แห่งนี้เพื่อสะท้อนมุมมองและอัปเดตไอเทมใหม่ๆ ที่ตอบโจทย์การใช้ชีวิตยุคใหม่ของคุณ ติดตามไลฟ์สไตล์ในแบบฉบับคนเมืองกับผมได้ที่ช่องทางโซเชียลมีเดียครับ

ดูบทความทั้งหมด →