ลดเวลา Train โมเดลด้วย Large Language Model & Specialized LLMs

การนำ Large Language Model และ Specialized LLMs มาใช้เพื่อลดเวลาการ Train โมเดลของ UiPath Document Understanding

ในยุคที่ธุรกิจต้องเผชิญกับข้อมูลจำนวนมหาศาลและหลากหลายรูปแบบ การใช้ปัญญาประดิษฐ์ (AI) และ automation กลายเป็นเครื่องมือสำคัญในการเพิ่มประสิทธิภาพการทำงาน อย่างไรก็ตาม ความท้าทายที่ยังคงอยู่คือการจัดการกับข้อมูลจากเอกสารที่ไม่เป็นดิจิทัล เช่น ไฟล์สแกน, เอกสารที่ถูกอัปโหลดมาในรูปแบบที่ไม่ตายตัว หรือแม้แต่ใบเสร็จที่ถูกถ่ายจากกล้องมือถือ ซึ่งไม่สามารถนำไปใช้งานได้โดยตรง

ในงาน AI-Powered Automation Summit 2024 ที่กรุงเทพฯ UiPath ได้เปิดตัวการพัฒนา large language model (LLM) ของตนเอง และนำเสนอ specialized LLMs ที่ถูกออกแบบมาเพื่อการทำงานกับ UiPath Document Understanding (DU) โดยเฉพาะ จุดประสงค์หลักคือเพื่อลดเวลาในการ train โมเดล, เพิ่มความแม่นยำ และรองรับการใช้งานที่ซับซ้อนมากขึ้น

ความท้าทายของข้อมูลที่ไม่เป็น Digital

องค์กรส่วนใหญ่ยังคงมีข้อมูลในรูปแบบที่ไม่เป็นดิจิทัล ซึ่งเป็นอุปสรรคต่อการประมวลผลและการใช้งานข้อมูลในระบบดิจิทัล ตัวอย่างเช่น:
– การดึง part number จากเอกสาร design specification เพื่อนำไปสร้าง Bill of Material (BOM) ในระบบ ERP
– การนำรายการยาและอุปกรณ์ทางการแพทย์จาก invoice ไปใช้ในกระบวนการเคลมของบริษัทประกัน
– การอ่านใบเสร็จรับเงินที่ถูกถ่ายด้วยกล้องมือถือ ซึ่งอาจเบลอหรือเอียง
– การจัดการกับสัญญาเช่าหรือสัญญาทางกฎหมายที่มีข้อความยาวและซับซ้อน

ความไม่เป็นโครงสร้าง (unstructured) ของข้อมูลเหล่านี้ ทำให้การประมวลผลอัตโนมัติเป็นเรื่องยาก และจำเป็นต้องมีโมเดล AI ที่ได้รับการ train อย่างเฉพาะเจาะจงเพื่อเข้าใจ context ของเอกสารแต่ละประเภท

ข้อจำกัดเดิมของการ Train โมเดล

ก่อนที่จะมีการใช้ specialized LLMs การทำงานของ UiPath Document Understanding ต้องพึ่งพาโมเดลที่ต้อง train จากข้อมูลจำนวนมาก ซึ่งมาพร้อมกับข้อจำกัดดังนี้:
– ต้องใช้ data labeling ที่ใช้เวลานานและต้องการผู้เชี่ยวชาญ
– ต้องมี dataset จำนวนมากเพื่อให้ได้ความแม่นยำที่ยอมรับได้
– เมื่อเจอเอกสารรูปแบบใหม่ ต้องใช้เวลา train โมเดลเพิ่ม ซึ่งทำให้การนำไปใช้งานจริงล่าช้า

ถึงแม้ว่า Document Understanding จะรองรับการอ่านภาษาไทย, checkbox, หรือแม้แต่เอกสารเอียงแล้ว แต่ก็ยังมีความท้าทายในการทำงานกับเอกสารที่ซับซ้อนมากขึ้น เช่น เอกสารหลายหน้า, เอกสารที่มีตาราง หรือเอกสารที่มีภาษาผสมกัน

Specialized LLMs: คำตอบของ UiPath

เพื่อแก้ปัญหาดังกล่าว UiPath ได้พัฒนา specialized LLMs ซึ่งเป็น large language model ที่ถูกออกแบบและฝึกมาโดยเฉพาะสำหรับการจัดการเอกสารและ automation โดยตรง

ประโยชน์ที่ได้จากการใช้ specialized LLMs ได้แก่:
– ลดเวลาในการ train โมเดล → ไม่จำเป็นต้อง train ใหม่ทุกครั้งที่เจอเอกสารรูปแบบใหม่
– เพิ่มความแม่นยำ → เข้าใจ context ของเอกสารได้ดีกว่า generic LLMs
– รองรับความซับซ้อน → สามารถดึงข้อมูลจากเอกสารที่มีหลายรูปแบบได้ในเวลาเดียวกัน

ความแตกต่างระหว่าง Generic LLM และ Specialized LLM

– Generic LLM: ถูกออกแบบมาเพื่อการใช้งานทั่วไป เช่น การสนทนา, การเขียนข้อความ แต่ไม่เจาะจงกับงานเอกสาร
– Specialized LLM: ถูกฝึกให้เข้าใจโครงสร้างและภาษาของเอกสารธุรกิจ เช่น ใบเสร็จ, ใบกำกับภาษี, สัญญา และ invoice

ประโยชน์ของ Specialized LLMs ต่อองค์กร

1.ความรวดเร็ว: ลดเวลา train จากเป็นวันเหลือเพียงไม่กี่ชั่วโมง
2. ประสิทธิภาพ: ลดความผิดพลาดในการดึงข้อมูล (extraction error)
3. ความยืดหยุ่น: รองรับเอกสารใหม่ได้โดยไม่ต้อง train ซ้ำบ่อยๆ
4. ต้นทุนต่ำลง: ลดค่าใช้จ่ายในการทำ data labeling และ retraining

Dictionary editor ของ UiPath สำหรับการกำหนด Key และ Value เพื่อดึงข้อมูลผู้สมัครงานอัตโนมัติ

 

ภาพตัวอย่าง Dictionary editor สำหรับการดึงข้อมูล

การใช้งานร่วมกับ Generative AI

UiPath ไม่ได้หยุดแค่การพัฒนา specialized LLMs แต่ยังผสานกับความสามารถของ Generative AI เพื่อเพิ่มศักยภาพให้ Document Understanding

Generative Extractor

 เป็นฟีเจอร์ที่ให้ผู้ใช้สามารถกำหนดข้อมูลที่ต้องการดึงจากเอกสารด้วย prompt เช่น:
– ดึงข้อมูลผู้สมัครงานจากเรซูเม่
– ดึงเลขที่บัญชีและชื่อจากใบแจ้งหนี้
– ดึงวันหมดอายุของกรมธรรม์จากสัญญา

การใช้งานจริง

– HR: อ่านเรซูเม่และกรอกข้อมูลผู้สมัครเข้าสู่ระบบอัตโนมัติ
– Finance: ประมวลผลใบกำกับภาษีและใบเสร็จรับเงินเพื่อลดการทำงาน manual
– Insurance: อ่านใบเคลมและนำข้อมูลไปสู่ระบบตรวจสอบโดยอัตโนมัติ

 

ผลลัพธ์จากการทดสอบ: UiPath DocPath

จากผลการทดสอบของ UiPath AI R&D พบว่า:
– GenAI tools ทั่วไปมี error rate สูงถึง 35.6%
– Tier 1 IDP vendors อยู่ที่ 13.1%
– UiPath pre-DocPath อยู่ที่ 6.7%
– และ UiPath DocPath ลดเหลือเพียง 4.7%

แสดงให้เห็นว่า specialized LLMs ที่ UiPath พัฒนามีความแม่นยำสูงกว่าเครื่องมือทั่วไป และช่วยลดความผิดพลาดในการดึงข้อมูลอย่างชัดเจน

 

กราฟเปรียบเทียบอัตราความผิดพลาดในการดึงข้อมูลระหว่าง GenAI tools, Tier 1 IDP vendors และ UiPath DocPath

การเชื่อมต่อกับ Context Grounding และ AI Trust Layer

นอกจาก specialized LLMs แล้ว UiPath ยังมุ่งเน้นด้านความแม่นยำและความปลอดภัยของ Generative AI ผ่าน Context Grounding และ AI Trust Layer ซึ่งช่วย:
– ลดโอกาสที่ AI จะให้คำตอบผิด (hallucination)
– ทำให้ผลลัพธ์อ้างอิงจากข้อมูลจริงขององค์กร
– สร้างความมั่นใจให้กับการใช้งาน AI ในระดับ enterprise

อ่านเพิ่มเติมได้ที่: https://automatconsult.com/uipath-context-grounding-ai-trust-layer/

สรุป: ศักยภาพใหม่ของ Large Language Model และ Specialized LLMs

การนำ large language model มาปรับใช้ในรูปแบบของ specialized LLMs ช่วยให้องค์กรสามารถ:
– ลดเวลา train โมเดล
– เพิ่มความแม่นยำในการประมวลผลเอกสาร
– รองรับการใช้งานที่ซับซ้อนหลากหลายมากขึ้น
– เชื่อมต่อกับ Generative AI เพื่อเพิ่มความสามารถในการดึงข้อมูลเชิงลึก

ด้วยการผสาน specialized LLMs และ UiPath Document Understanding องค์กรจะสามารถก้าวข้ามข้อจำกัดเดิมๆ และยกระดับการทำงานอัตโนมัติไปอีกขั้น

🚀 อยากให้ AI ช่วยงานเอกสารในองค์กรคุณใช่ไหม?
Automat Consulting พร้อมช่วยออกแบบโซลูชันที่เหมาะสม 👉 ดูบริการทั้งหมด

Menu