ในยุคที่เทคโนโลยีปัญญาประดิษฐ์ก้าวหน้าไปอย่างรวดเร็ว หนึ่งในความท้าทายที่นักพัฒนา AI ต้องเผชิญคือการสร้าง ภาพ AI ให้สมจริงจนแยกไม่ออก โดยเฉพาะอย่างยิ่งในรายละเอียดเล็กๆ น้อยๆ ที่มักจะเป็นจุดสังเกตสำคัญ ล่าสุด OpenAI ได้เปิดตัว Images 2.0 ซึ่งเป็นโมเดล AI สร้างภาพรุ่นใหม่ล่าสุดสำหรับ ChatGPT ที่เข้ามาเติมเต็มช่องว่างนี้ โดยเฉพาะอย่างยิ่งในเรื่องของการสร้างข้อความภายในภาพ ที่ก่อนหน้านี้มักเป็นจุดอ่อนของโมเดล AI ทั่วไป
จุดเปลี่ยนสำคัญ: ข้อความในภาพ AI ที่สมจริงขึ้น
ตลอดระยะเวลาที่ผ่านมา ผู้ใช้งานหรือผู้เชี่ยวชาญมักจะอาศัยข้อบกพร่องในการสร้างข้อความบนภาพ เพื่อระบุว่าภาพนั้นถูกสร้างโดย AI หรือไม่ ไม่ว่าจะเป็นตัวอักษรที่ผิดเพี้ยน ตัวสะกดที่ผิดพลาด หรือการเรียงตัวของคำที่ไม่เป็นธรรมชาติ ซึ่งชวนให้นึกถึงภาษาต่างดาวในภาพยนตร์ แต่ด้วย Images 2.0 ของ OpenAI ปัญหาเหล่านี้กำลังจะกลายเป็นอดีต โมเดลใหม่นี้สามารถสร้างข้อความภายในภาพได้สมจริงอย่างน่าทึ่ง ทำให้ภาพดูเป็นธรรมชาติและน่าเชื่อถือมากขึ้นไปอีกขั้น ยากที่จะแยกแยะได้ด้วยตาเปล่าว่าส่วนไหนคือภาพจริงและส่วนไหนคือผลงานของ AI
เบื้องหลังความอัจฉริยะของ Images 2.0
OpenAI เผยว่า Images 2.0 เป็นโมเดลสร้างภาพแรกของบริษัทที่มี “ความสามารถในการคิดวิเคราะห์” (thinking capabilities) หมายความว่า AI สามารถใช้เวลาในการวิเคราะห์และประมวลผลคำขอในแต่ละขั้นตอนได้อย่างละเอียดลึกซึ้ง ส่งผลให้ได้ภาพที่มีรายละเอียดแม่นยำและสมจริงยิ่งขึ้น นอกจากนี้ ผู้ใช้งานแบบเสียเงิน (paid subscribers) ยังสามารถสร้างภาพได้มากถึงแปดภาพจากการป้อนคำสั่ง (prompt) เพียงครั้งเดียว ขณะที่ผู้ใช้งานทั่วไป (free users) ก็ยังคงได้รับประโยชน์จากความสามารถของ Images 2.0 ในการค้นหาข้อมูลบนเว็บและตรวจสอบความถูกต้องของผลงาน เพื่อให้มั่นใจว่าผลลัพธ์ที่ได้นั้น “รู้สึกเหมือนถูกออกแบบมาอย่างตั้งใจมากกว่าถูกสร้างโดย AI”
ความหลากหลายในการสร้างสรรค์ภาพ
สิ่งที่น่าประทับใจอีกอย่างของ Images 2.0 คือความสามารถในการสร้างภาพได้หลากหลายประเภท ไม่ใช่แค่ภาพถ่ายที่ดูสมจริงเท่านั้น แต่ยังครอบคลุมถึง:
- ภาพถ่ายแบบสมจริง (Photorealistic pictures)
- ภาพหน้าจอ UI คอมพิวเตอร์ (Screenshots of a computer’s UI)
- ภาพตัดปะจากนิตยสาร (Magazine collages)
- หน้าหนิตยสาร (Magazine pages)
- เรียงความที่เขียนด้วยลายมือ (Handwritten essays) พร้อมรายละเอียดเล็กๆ น้อยๆ เช่น รอยคราบกาแฟบนกระดาษ
- หน้าการ์ตูนกราฟิกโนเวล (Graphic novel pages)
- โปสเตอร์ภาพยนตร์ (Movie posters)
- ภาพที่มีอัตราส่วนแตกต่างกัน (Different aspect ratios) รวมถึงมุมมองพาโนรามาของ iPhone
แม้จะมีความสามารถที่โดดเด่น แต่ Images 2.0 ก็ยังมีข้อจำกัดอยู่บ้าง เช่น ยังคงมีปัญหาในการสร้างสรรค์งานที่ซับซ้อนมากๆ อย่างปริศนา หรือรายละเอียดที่อยู่ในจุดที่ซ่อนอยู่หรือวางตำแหน่งแปลกๆ เช่น พื้นผิวที่กลับด้าน อย่างไรก็ตาม จุดอ่อนเหล่านี้ไม่ได้บดบังความสามารถหลักที่สามารถหลอกสายตาคนส่วนใหญ่ได้อย่างน่าทึ่ง
อนาคตของภาพ AI กับมุมมองจากบรรณาธิการ
ในฐานะผู้ติดตามความก้าวหน้าทางเทคโนโลยี เรามองว่า Images 2.0 ของ OpenAI ไม่ใช่แค่การอัปเกรดธรรมดา แต่เป็นการก้าวข้ามขีดจำกัดที่สำคัญของ ภาพ AI อย่างแท้จริง การที่ AI สามารถสร้างข้อความในภาพได้สมจริงระดับนี้ เป็นการลบ “จุดบอด” ที่เคยเป็นข้อสังเกตออกไปได้อย่างมีนัยสำคัญ ส่งผลให้ขอบเขตการใช้งานภาพที่สร้างจาก AI จะขยายกว้างขึ้นอย่างมหาศาล ไม่ว่าจะเป็นงานกราฟิก การโฆษณา หรือแม้แต่การสร้างเนื้อหาสำหรับการเล่าเรื่อง ซึ่งหมายความว่าในอนาคตอันใกล้นี้ เราทุกคนจะได้เห็นภาพที่สร้างโดย AI ปรากฏในชีวิตประจำวันมากขึ้นเรื่อยๆ จนอาจแยกไม่ออกว่าสิ่งที่เราเห็นอยู่นั้นเป็นภาพจริงหรือภาพที่เกิดจากจินตนาการของปัญญาประดิษฐ์ ซึ่งเป็นทั้งความน่าตื่นเต้นและความท้าทายใหม่ที่เราต้องเรียนรู้ที่จะอยู่ร่วมกับมัน
ที่มา: lifehacker.com
ข่าวที่เกี่ยวข้อง
- TikTok ทดลองฟีเจอร์ AI Remix สร้างมีมจากวิดีโอคุณ พร้อมข้อกังวลด้านความเป็นส่วนตัว
- พ็อกเก็ตไวไฟ Solis Edge 5G: ฮีโร่ผู้กอบกู้สัญญาณในยามฉุกเฉินและเดินทางทั่วโลก
- Gaussian Splatting: เทคโนโลยีปฏิวัติวงการบันทึกภาพ 3D เปลี่ยนความทรงจำให้กลับมามีชีวิต
- เคล็ดลับวิดพื้นหญิง: มุมการหิ้วไม่ใช่คำตอบสุดท้ายสำหรับท่าที่สมบูรณ์แบบ