การนำ Large Language Model และ Specialized LLMs มาใช้เพื่อลดเวลาการ Train โมเดลของ UiPath Document Understanding
ในยุคที่ธุรกิจต้องเผชิญกับข้อมูลจำนวนมหาศาลและหลากหลายรูปแบบ การใช้ปัญญาประดิษฐ์ (AI) และ automation กลายเป็นเครื่องมือสำคัญในการเพิ่มประสิทธิภาพการทำงาน อย่างไรก็ตาม ความท้าทายที่ยังคงอยู่คือการจัดการกับข้อมูลจากเอกสารที่ไม่เป็นดิจิทัล เช่น ไฟล์สแกน, เอกสารที่ถูกอัปโหลดมาในรูปแบบที่ไม่ตายตัว หรือแม้แต่ใบเสร็จที่ถูกถ่ายจากกล้องมือถือ ซึ่งไม่สามารถนำไปใช้งานได้โดยตรง
ในงาน AI-Powered Automation Summit 2024 ที่กรุงเทพฯ UiPath ได้เปิดตัวการพัฒนา large language model (LLM) ของตนเอง และนำเสนอ specialized LLMs ที่ถูกออกแบบมาเพื่อการทำงานกับ UiPath Document Understanding (DU) โดยเฉพาะ จุดประสงค์หลักคือเพื่อลดเวลาในการ train โมเดล, เพิ่มความแม่นยำ และรองรับการใช้งานที่ซับซ้อนมากขึ้น
ความท้าทายของข้อมูลที่ไม่เป็น Digital
องค์กรส่วนใหญ่ยังคงมีข้อมูลในรูปแบบที่ไม่เป็นดิจิทัล ซึ่งเป็นอุปสรรคต่อการประมวลผลและการใช้งานข้อมูลในระบบดิจิทัล ตัวอย่างเช่น:
– การดึง part number จากเอกสาร design specification เพื่อนำไปสร้าง Bill of Material (BOM) ในระบบ ERP
– การนำรายการยาและอุปกรณ์ทางการแพทย์จาก invoice ไปใช้ในกระบวนการเคลมของบริษัทประกัน
– การอ่านใบเสร็จรับเงินที่ถูกถ่ายด้วยกล้องมือถือ ซึ่งอาจเบลอหรือเอียง
– การจัดการกับสัญญาเช่าหรือสัญญาทางกฎหมายที่มีข้อความยาวและซับซ้อน
ความไม่เป็นโครงสร้าง (unstructured) ของข้อมูลเหล่านี้ ทำให้การประมวลผลอัตโนมัติเป็นเรื่องยาก และจำเป็นต้องมีโมเดล AI ที่ได้รับการ train อย่างเฉพาะเจาะจงเพื่อเข้าใจ context ของเอกสารแต่ละประเภท
ข้อจำกัดเดิมของการ Train โมเดล
ก่อนที่จะมีการใช้ specialized LLMs การทำงานของ UiPath Document Understanding ต้องพึ่งพาโมเดลที่ต้อง train จากข้อมูลจำนวนมาก ซึ่งมาพร้อมกับข้อจำกัดดังนี้:
– ต้องใช้ data labeling ที่ใช้เวลานานและต้องการผู้เชี่ยวชาญ
– ต้องมี dataset จำนวนมากเพื่อให้ได้ความแม่นยำที่ยอมรับได้
– เมื่อเจอเอกสารรูปแบบใหม่ ต้องใช้เวลา train โมเดลเพิ่ม ซึ่งทำให้การนำไปใช้งานจริงล่าช้า
ถึงแม้ว่า Document Understanding จะรองรับการอ่านภาษาไทย, checkbox, หรือแม้แต่เอกสารเอียงแล้ว แต่ก็ยังมีความท้าทายในการทำงานกับเอกสารที่ซับซ้อนมากขึ้น เช่น เอกสารหลายหน้า, เอกสารที่มีตาราง หรือเอกสารที่มีภาษาผสมกัน
Specialized LLMs: คำตอบของ UiPath
เพื่อแก้ปัญหาดังกล่าว UiPath ได้พัฒนา specialized LLMs ซึ่งเป็น large language model ที่ถูกออกแบบและฝึกมาโดยเฉพาะสำหรับการจัดการเอกสารและ automation โดยตรง
ประโยชน์ที่ได้จากการใช้ specialized LLMs ได้แก่:
– ลดเวลาในการ train โมเดล → ไม่จำเป็นต้อง train ใหม่ทุกครั้งที่เจอเอกสารรูปแบบใหม่
– เพิ่มความแม่นยำ → เข้าใจ context ของเอกสารได้ดีกว่า generic LLMs
– รองรับความซับซ้อน → สามารถดึงข้อมูลจากเอกสารที่มีหลายรูปแบบได้ในเวลาเดียวกัน
ความแตกต่างระหว่าง Generic LLM และ Specialized LLM
– Generic LLM: ถูกออกแบบมาเพื่อการใช้งานทั่วไป เช่น การสนทนา, การเขียนข้อความ แต่ไม่เจาะจงกับงานเอกสาร
– Specialized LLM: ถูกฝึกให้เข้าใจโครงสร้างและภาษาของเอกสารธุรกิจ เช่น ใบเสร็จ, ใบกำกับภาษี, สัญญา และ invoice
ประโยชน์ของ Specialized LLMs ต่อองค์กร
1.ความรวดเร็ว: ลดเวลา train จากเป็นวันเหลือเพียงไม่กี่ชั่วโมง
2. ประสิทธิภาพ: ลดความผิดพลาดในการดึงข้อมูล (extraction error)
3. ความยืดหยุ่น: รองรับเอกสารใหม่ได้โดยไม่ต้อง train ซ้ำบ่อยๆ
4. ต้นทุนต่ำลง: ลดค่าใช้จ่ายในการทำ data labeling และ retraining
ภาพตัวอย่าง Dictionary editor สำหรับการดึงข้อมูล
การใช้งานร่วมกับ Generative AI
UiPath ไม่ได้หยุดแค่การพัฒนา specialized LLMs แต่ยังผสานกับความสามารถของ Generative AI เพื่อเพิ่มศักยภาพให้ Document Understanding
Generative Extractor
เป็นฟีเจอร์ที่ให้ผู้ใช้สามารถกำหนดข้อมูลที่ต้องการดึงจากเอกสารด้วย prompt เช่น:
– ดึงข้อมูลผู้สมัครงานจากเรซูเม่
– ดึงเลขที่บัญชีและชื่อจากใบแจ้งหนี้
– ดึงวันหมดอายุของกรมธรรม์จากสัญญา
การใช้งานจริง
– HR: อ่านเรซูเม่และกรอกข้อมูลผู้สมัครเข้าสู่ระบบอัตโนมัติ
– Finance: ประมวลผลใบกำกับภาษีและใบเสร็จรับเงินเพื่อลดการทำงาน manual
– Insurance: อ่านใบเคลมและนำข้อมูลไปสู่ระบบตรวจสอบโดยอัตโนมัติ
ผลลัพธ์จากการทดสอบ: UiPath DocPath
จากผลการทดสอบของ UiPath AI R&D พบว่า:
– GenAI tools ทั่วไปมี error rate สูงถึง 35.6%
– Tier 1 IDP vendors อยู่ที่ 13.1%
– UiPath pre-DocPath อยู่ที่ 6.7%
– และ UiPath DocPath ลดเหลือเพียง 4.7%
แสดงให้เห็นว่า specialized LLMs ที่ UiPath พัฒนามีความแม่นยำสูงกว่าเครื่องมือทั่วไป และช่วยลดความผิดพลาดในการดึงข้อมูลอย่างชัดเจน
การเชื่อมต่อกับ Context Grounding และ AI Trust Layer
นอกจาก specialized LLMs แล้ว UiPath ยังมุ่งเน้นด้านความแม่นยำและความปลอดภัยของ Generative AI ผ่าน Context Grounding และ AI Trust Layer ซึ่งช่วย:
– ลดโอกาสที่ AI จะให้คำตอบผิด (hallucination)
– ทำให้ผลลัพธ์อ้างอิงจากข้อมูลจริงขององค์กร
– สร้างความมั่นใจให้กับการใช้งาน AI ในระดับ enterprise
อ่านเพิ่มเติมได้ที่: https://automatconsult.com/uipath-context-grounding-ai-trust-layer/
สรุป: ศักยภาพใหม่ของ Large Language Model และ Specialized LLMs
การนำ large language model มาปรับใช้ในรูปแบบของ specialized LLMs ช่วยให้องค์กรสามารถ:
– ลดเวลา train โมเดล
– เพิ่มความแม่นยำในการประมวลผลเอกสาร
– รองรับการใช้งานที่ซับซ้อนหลากหลายมากขึ้น
– เชื่อมต่อกับ Generative AI เพื่อเพิ่มความสามารถในการดึงข้อมูลเชิงลึก
ด้วยการผสาน specialized LLMs และ UiPath Document Understanding องค์กรจะสามารถก้าวข้ามข้อจำกัดเดิมๆ และยกระดับการทำงานอัตโนมัติไปอีกขั้น
🚀 อยากให้ AI ช่วยงานเอกสารในองค์กรคุณใช่ไหม?
Automat Consulting พร้อมช่วยออกแบบโซลูชันที่เหมาะสม 👉 ดูบริการทั้งหมด






