Google สร้างความเคลื่อนไหวอีกครั้งในวงการ AI ด้วยการเปิดตัวบริการใหม่ล่าสุดในรูปแบบแอปพลิเคชันถอดเสียงแบบออฟไลน์สำหรับ iPhone โดยใช้ชื่อว่า “Google AI Edge Eloquent” แอปนี้โดดเด่นด้วยสถาปัตยกรรม Gemma ของ Google และความสามารถในการประมวลผลบนตัวเครื่อง แต่ในขณะเดียวกันก็นำมาซึ่งข้อถกเถียงเรื่องนโยบายความเป็นส่วนตัวที่ดูจะขัดแย้งกับคุณสมบัติหลักที่โฆษณาไว้
Google AI Edge Eloquent: แอปถอดเสียงอัจฉริยะจาก Google
แทนที่จะรวมฟังก์ชันนี้เข้ากับแอป Gemini ที่มีอยู่แล้ว Google กลับเลือกที่จะเปิดตัว “Google AI Edge Eloquent” เป็นแอปพลิเคชันแยกต่างหากบน iPhone ซึ่งเป็นโปรแกรมถอดเสียงที่ออกแบบมาเพื่อทำงานแบบออฟไลน์เป็นหลัก หลังจากการติดตั้งและตั้งค่าเบื้องต้นที่ไม่ซับซ้อน ผู้ใช้จะถูกขอให้บันทึกประโยคตัวอย่างเพื่อการปรับจูน
แอปนี้มีโหมดการทำงานหลักสองแบบ:
- On-device mode (โหมดประมวลผลบนเครื่อง): เป็นโหมดการทำงานแบบออฟไลน์เต็มรูปแบบ ข้อมูลเสียงและการสนทนาทั้งหมดจะถูกจัดเก็บไว้บนอุปกรณ์ของคุณเท่านั้น ไม่มีการส่งข้อมูลออกนอกเครื่อง
- Enhanced text polishing (โหมดปรับปรุงข้อความ): ในโหมดนี้ ไฟล์เสียงยังคงอยู่บนอุปกรณ์ของคุณ แต่จะใช้ Gemini ในการ “ขัดเกลา” ข้อความที่ถอดเสียงให้สมบูรณ์ยิ่งขึ้น ซึ่งหมายความว่าข้อมูลบางส่วนจะต้องถูกส่งไปยังระบบคลาวด์เพื่อการประมวลผล
จากการทดสอบเบื้องต้นพบว่าแอปมักจะเปิดในโหมด “Enhanced text polishing” เป็นค่าเริ่มต้น แต่ผู้ใช้สามารถสลับไปใช้ “On-device mode” ได้อย่างง่ายดายด้วยการแตะปุ่มสลับที่มุมขวาบนของหน้าจอหลัก นอกจากนี้ แอปยังมีความสามารถในการลบคำฟุ่มเฟือย (filler words) เช่น “เอ่อ” หรือ “อืม” ออกจากข้อความถอดเสียงโดยอัตโนมัติ
ประเด็นความเป็นส่วนตัวที่ยังคงเป็นคำถาม
แม้ว่า Google จะโฆษณาว่า “ข้อมูลเสียง การสนทนาที่เป็นความลับ และข้อมูลส่วนตัวจะไม่ถูกส่งออกจากอุปกรณ์ของคุณ” แต่รายละเอียดในนโยบายความเป็นส่วนตัวกลับสร้างความกังวลอย่างมาก นโยบายระบุว่า Google สามารถเชื่อมโยงข้อมูลหลายประเภทกับตัวผู้ใช้ได้ ซึ่งรวมถึงตำแหน่งที่ตั้ง รายชื่อติดต่อ รหัสระบุตัวตน ข้อมูลการวินิจฉัยอุปกรณ์ ข้อมูลติดต่อ เนื้อหาที่ผู้ใช้สร้างขึ้น ข้อมูลการใช้งาน และข้อมูล “อื่นๆ” นอกจากนี้ยังมีการเก็บข้อมูลการซื้อและข้อมูลการวินิจฉัยอื่นๆ โดยไม่เชื่อมโยงกับตัวตนของผู้ใช้
ข้อมูลจำนวนมหาศาลนี้ทำให้เกิดคำถามถึงความโปร่งใสและขอบเขตของการประมวลผลข้อมูล โดยเฉพาะเมื่อโหมด “Enhanced text polishing” มีการส่งข้อมูลไปยังคลาวด์ ซึ่งอาจเป็นจุดที่ข้อมูลเหล่านี้ถูกเก็บรวบรวม ผู้ใช้งานจึงควรพิจารณาให้ดีก่อนตัดสินใจใช้งานโหมดนี้ หากกังวลเรื่องความเป็นส่วนตัว ทาง Google เองยังไม่ได้ให้คำชี้แจงเพิ่มเติมในประเด็นนี้
ประสิทธิภาพและฟีเจอร์เด่นที่น่าสนใจ
ในการทดสอบเบื้องต้น พบว่าแอป “Google AI Edge Eloquent” มีประสิทธิภาพที่น่าประทับใจ แม้จะมีปัญหาเล็กน้อยในการเริ่มใช้งานครั้งแรกที่ต้องมีการจับคู่และเลิกจับคู่ AirPods กับ iPhone เพื่อให้แอปทำงานได้ แต่เมื่อใช้งานได้แล้ว การถอดเสียงมีความแม่นยำเกือบสมบูรณ์ โดยแอปสามารถแก้ไขคำที่ถอดผิดให้ถูกต้องได้เองเมื่อมีบริบทเพิ่มเติมเข้ามา
นอกจากการถอดเสียงที่แม่นยำแล้ว แอปยังมีฟีเจอร์อื่นๆ ที่ช่วยเสริมการใช้งาน:
- การแก้ไขข้อความด้วยตนเอง: ผู้ใช้สามารถแตะไอคอนรูปดินสอเพื่อแก้ไขข้อความที่ถอดเสียงได้ด้วยตัวเอง หาก AI ถอดเสียงผิดพลาด
- สถิติการใช้งาน: สามารถดูสถิติต่างๆ เช่น จำนวนคำที่พูด จำนวนคำต่อนาที และจำนวนการแก้ไขที่ AI ทำ
- เครื่องมือแก้ไข AI เพิ่มเติม (สำหรับโหมด Gemini): หากเปิดใช้งาน Gemini ผู้ใช้จะเข้าถึงเครื่องมือ AI ขั้นสูงเพิ่มเติม เช่น “Key Points” (สรุปประเด็นสำคัญ), “Formal” (ปรับเป็นทางการ), “Short” (ย่อ), และ “Long” (ขยายความ)
- คัดลอกข้อความ: เมื่อพอใจกับการถอดเสียง สามารถคัดลอกข้อความไปยังคลิปบอร์ดเพื่อนำไปใช้งานต่อได้ทันที
- ประวัติและพจนานุกรมส่วนตัว: แท็บ “History” ให้ผู้ใช้กลับไปดูและแก้ไขการถอดเสียงครั้งก่อนๆ ส่วนแท็บ “Dictionaries” ช่วยให้เพิ่มคำศัพท์เฉพาะทางที่ AI อาจไม่รู้จัก เพื่อเพิ่มความแม่นยำในการถอดเสียงในอนาคต
มุมมองจากบรรณาธิการ: Google AI Edge Eloquent น่าใช้แค่ไหน?
จากภาพรวมของแอป Google AI Edge Eloquent เรามองว่านี่คืออีกก้าวที่น่าสนใจของ Google ในการนำ AI มาใช้ในชีวิตประจำวัน โดยเฉพาะอย่างยิ่งฟีเจอร์การประมวลผลบนเครื่อง (On-device mode) ที่ให้ความสำคัญกับความเป็นส่วนตัว ซึ่งเป็นจุดแข็งที่ทำให้แอปนี้โดดเด่นกว่าเครื่องมือถอดเสียงอื่นๆ หรือแม้แต่ฟังก์ชันถอดเสียงใน iOS เอง หาก Google สามารถให้ความชัดเจนเกี่ยวกับนโยบายความเป็นส่วนตัวและพิสูจน์ได้ว่าในโหมดออฟไลน์นั้นข้อมูลส่วนตัวจะไม่รั่วไหลไปไหนจริง ๆ แอปนี้ก็มีศักยภาพที่จะกลายเป็นเครื่องมือสำคัญสำหรับผู้ที่ต้องถอดเสียงบ่อย ๆ ไม่ว่าจะเป็นนักศึกษา นักข่าว หรือผู้ใช้งานทั่วไปที่ต้องการความแม่นยำและความเป็นส่วนตัว
ส่วนตัวแล้ว หากความแม่นยำและความเร็วในการทำงานเหนือกว่าฟังก์ชันที่มาพร้อมกับ iOS อย่างชัดเจน และประเด็นเรื่องความเป็นส่วนตัวได้รับการแก้ไขอย่างโปร่งใส เราก็พร้อมที่จะพิจารณาใช้ Google AI Edge Eloquent เป็นทางเลือกหลัก อย่างไรก็ตาม การตัดสินใจเลือกใช้งานคงต้องขึ้นอยู่กับความสำคัญของความเป็นส่วนตัวสำหรับแต่ละบุคคล และการรอคำชี้แจงเพิ่มเติมจาก Google ในอนาคต
ที่มา: lifehacker.com
ข่าวที่เกี่ยวข้อง
- Google อัปเดต Gemini ครั้งใหญ่ เน้นความปลอดภัยและสุขภาพจิตของผู้ใช้ โดยเฉพาะเยาวชน
- Gemini ใน Google Maps เริ่มขยายวงกว้าง ยกระดับประสบการณ์นำทางอัจฉริยะบนท้องถนน
- จอ Samsung Movingstyle M7 ลดราคาครั้งใหญ่ มอนิเตอร์ 4K อัจฉริยะ พร้อมขาตั้งเคลื่อนที่ ตอบโจทย์ทุกไลฟ์สไตล์
- Ecobee Comfort and Security Bundle มอบข้อเสนอสุดคุ้ม ยกระดับบ้านอัจฉริยะทั้งความสบายและความปลอดภัย