Loading...

พัฒนา AI ต่อยอดสู่ ‘ThaiKALA’ เครื่องมือตอบคำถามภาษาไทย จากเด็ก SIIT ธรรมศาสตร์

นักศึกษาสถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) ธรรมศาสตร์ คว้ารางวัลชนะเลิศอันดับ 1 เหรียญทอง Super AI Engineer Season 3 และผลงานได้ถูกตีพิมพ์เป็น Paper แล้ว

วันพฤหัสบดีที่ 1 กุมภาพันธ์ พ.ศ.2567

     ขอแสดงความยินดีและพูดคุยกับ ปวริศ เรืองจุติโพธิ์พาน นักศึกษาชั้นปีที่ 4 สาขาวิศวกรรมคอมพิวเตอร์ ภาควิชาเทคโนโลยีสารสนเทศ คอมพิวเตอร์ และการสื่อสาร สถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) มหาวิทยาลัยธรรมศาสตร์ ได้รับรางวัลชนะเลิศอันดับ 1 เหรียญทอง จากโครงการพัฒนานวัตกร-วิศวกร-นักวิจัย-วิสาหกิจเริ่มต้น ด้านปัญญาประดิษฐ์ ‘สุดยอดวิศวกรปัญญาประดิษฐ์ Super AI Engineer Season 3’ เมื่อเร็ว ๆ นี้

อธิบายเกี่ยวกับโครงการฯ

     เป็นค่ายอบรมด้าน AI ร่วมกับการปฏิบัติจริงผ่านการแข่งขัน Hackathon เพื่อแก้โจทย์จากองค์กรต่าง ๆ ครับ เป็นค่ายระยะเวลา 1 ปี เพื่อแข่ง Hackathon ที่จัดขึ้นทุกสัปดาห์ โดยจะถูกแบ่งออกเป็นทีม (เลือกบ้าน) เราสามารถเลือกบ้านที่ตัวเองอยากเข้าได้ครับ และบ้านที่เราเลือกจะเป็นทีมที่เราต้องช่วยกันแก้โจทย์ Hackathon อยู่ด้วยกันตั้งแต่เริ่มวันแรกจนจบโครงการครับ

พูดถึงผลงาน ‘ThaiKALA’ ChatGPT ในเวอร์ชันภาษาไทย

     ผลงานชื่อว่า ‘Thai Knowledge Augmented Language Model Adaptation’ (ThaiKALA) ครับ ไอเดียเริ่มมาจากปัจจุบันมีการนำ AI มาใช้มากมายเต็มไปหมดครับ โดยหนึ่ง AI ที่เราเจอบ่อย คือเทคโนโลยีที่ชื่อว่า Language Model ตัวอย่างของ Language Model คือ ‘ChatGPT’ ที่สามารถตอบคำถามหลาย ๆ อย่างให้เราด้วยลักษณะการตอบที่เหมือนกับคนมาตอบคำถามเองครับ แต่โมเดลเหล่านี้ส่วนใหญ่ถูกสร้างขึ้นมาโดยมีภาษาอังกฤษเป็นภาษาหลัก ทำให้การตอบคำถามที่เป็นข้อมูลภาษาไทยยังไม่สามารถทำได้ดีเท่ากับภาษาอังกฤษ และถ้าเราอยากจะสร้างโมเดลให้สามารถทำงานได้ดีกับภาษาไทย เราจำเป็นต้องมีข้อมูลจำนวนมากในการสร้างมันขึ้นมา

     โดยตัวงานของผมจะนำข้อมูลประเภท Knowledge Graph ที่เก็บข้อมูลต่าง ๆ เอาไว้ โดยแต่ละชุดข้อมูลมีความเกี่ยวข้องและเชื่อมต่อกันในรูปแบบของ Graph มาใช้กับ Language Model ขนาดเล็กที่มีอยู่ในปัจจุบัน ผ่านตัว Framework ที่ชื่อ ‘ThaiKALA’ ที่เราได้พัฒนาขึ้นมา เพื่อให้โมเดลนั้น สามารถดึงความรู้จาก Knowledge Graph เข้ามาใช้ในการช่วยตอบคำถามต่าง ๆ แทนครับ

     งานชิ้นนี้ทำให้เห็นความพิเศษของข้อมูลประเภทนี้ครับว่า การนำข้อมูลประเภท Knowledge Graph มาใช้กับ Language Model ที่มีขนาดเล็ก ก็สามารถสร้างโมเดลที่มีความสามารถเทียบเท่ากับ ChatGPT ในการตอบคำถามภาษาไทยได้ แม้ว่าโมเดลนั้นจะมีขนาดเล็กกว่าหลายเท่าครับ ซึ่งงานชิ้นนี้ทำระหว่างที่เป็น Intern กับ Kasikorn Business Technology Group (KBTG) ปัจจุบันถูกตีพิมพ์เป็น Paper เรียบร้อยครับ สำหรับคนที่สนใจสามารถติดตามได้ที่ https://ieeexplore.ieee.org/document/10355001

เล่าถึงสิ่งที่รู้สึกว่ายากมากระหว่างการแข่ง และแชร์วิธีแก้ปัญหา

     สิ่งหนึ่งที่ยากมาก ๆ และจำขึ้นใจ คือ Hackathon ที่จัดขึ้นในแต่ละสัปดาห์ครับ ทุกโจทย์มาจากสิ่งที่แต่ละองค์กรนั้นเจอจริง ๆ และให้เราสร้างโมเดลเพื่อแก้ปัญหาเหล่านั้น ซึ่งบางรอบพอได้รับโจทย์มาแล้ว ไม่รู้วิธีแก้กันทั้งบ้านเลยก็มีครับ แต่ต้องแก้โจทย์ให้ได้ภายใน 5 วัน และยังต้องแข่งกับบ้านอื่น ๆ ด้วย ในจุดนี้การทำงานเป็นทีมร่วมกับผู้อื่นสำคัญมากครับ ต้องแบ่งหน้าที่รับผิดชอบกันให้ดี เช่น สัปดาห์นี้พี่คนนี้ถนัด น้องคนนี้เก่ง ก็จะให้นำแก้โจทย์ แล้วคนอื่น ๆ คอยช่วยซัพพอร์ตครับ

ความรู้พื้นฐานที่ดีจะต่อยอดให้เรา

     สำหรับคนที่สนใจอยากจะแข่งทางด้านเทคโนโลยี หรือ Hackathon ถ้าเราอยากเตรียมตัวแข่งอะไรสักอย่าง การมีความรู้พื้นฐานที่ดีจะต่อยอดให้เราได้มากเลยครับ ซึ่งหลักสูตรของ SIIT ก็ครอบคลุมพื้นฐานสำคัญ เพราะผมเองก็เป็นคนนึงที่เข้าเรียนทุกวิชาไม่เคยขาด ตั้งใจฟังอาจารย์ที่สอนในห้อง มีคำถามอะไรที่สงสัยก็ยกมือถามได้ทันที และมีส่วนร่วมกับเพื่อนในการทำงานกลุ่ม และทำให้เต็มที่ทุกครั้งครับ ซึ่งสิ่งพวกนี้จะฝึกพื้นฐานในการทำงานร่วมกับผู้อื่นไปในตัว แน่นอนว่าเรื่องเหล่านี้อาจจะเป็นเรื่องเล็กน้อย แต่พื้นฐานเล็กน้อยพวกนี้เป็นสิ่งที่สำคัญมาก ๆ ในการลงแข่งขันครับ

อย่ารอให้พร้อม จงเริ่มทำไปเลย

     ถ้าเราอยากจะทำอะไรสักอย่าง อย่ารอให้ตัวเองพร้อมก่อน แต่ให้ตัดสินใจเริ่มทำไปเลย เพราะผมเองตอนเข้าเรียนปี 1 ตอนนั้นยังไม่มีทักษะด้านการเขียนโปรแกรม แต่ก็สมัครเข้าโครงการไปทั้งที่ยังไม่เข้าใจสิ่งที่เรียกว่า AI ด้วยซ้ำ ซึ่งแน่นอนว่าพื้นฐานคอมพิวเตอร์ก็ไม่ได้ดีเท่ากับคนอื่น ๆ ที่มีประสบการณ์ ผมไม่ใช่คนที่เขียนโปรแกรมเก่งที่สุด ไม่ใช่คนที่แก้โจทย์ต่าง ๆ ได้เร็วที่สุด ผมเป็นแค่คนที่สนใจเทคโนโลยี AI และอยากเรียนรู้ประสบการณ์จากคนเก่งที่เข้ามาแข่งด้วยกัน ซึ่งตลอดระยะเวลาการแข่งขันนั้น ก็สนุกมากๆ ครับ

ทิ้งท้าย/ขอบคุณ

     ขอบคุณครอบครัวของผมที่คอยอยู่ข้าง ๆ และเป็นกำลังใจของผมมาเสมอครับ ขอบคุณ รศ.ดร.ภคินี เอมมณี ที่คอยสนับสนุนผมมาโดยตลอดครับ อาจารย์เป็นคนแรกที่คอยสนับสนุนผมตั้งแต่ที่ยังเขียนโปรแกรมไม่เป็นด้วยซ้ำครับ มาจนวันนี้ก็ได้มีโอกาสร่วมงานกับอาจารย์อยู่เสมอ เป็นประสบการณ์ที่ดีมากเลยครับ เหรียญนี้ไม่ใช่ของผมแค่คนเดียว แต่เป็นตัวแทนของทุกคนที่คอยสนับสนุนผมมาตลอดทางจนมีวันนี้ได้ครับ