1. การเตรียมไฟล์
- ไฟล์เนื้อหา: ต้องเป็นนามสกุล .txt เท่านั้น
- การแบ่งบท: ใช้เครื่องหมาย
# นำหน้าชื่อตอนเพื่อให้ระบบสร้างสารบัญ (เช่น # บทที่ 1: การเริ่มต้น)
2. ความเข้าใจเรื่อง Cleansing (% Similarity)
ระบบจะใช้ชื่อหนังสือและชื่อผู้แต่งไปกวาดล้าง (Clean) ข้อความขยะที่มักติดมาจากการ Copy หรือการจัดรูปแบบไฟล์ที่ซ้ำซ้อน
| ค่า % |
การทำงาน |
ผลลัพธ์ |
| 10% - 30% |
กรองแบบเข้มงวดสูง (Aggressive) |
ลบทุกอย่างที่ "คล้าย" ชื่อเรื่อง แม้จะต่างกันเยอะ (เหมาะกับไฟล์ที่ขยะเยอะมาก) |
| 40% - 60% |
ค่ามาตรฐาน (Recommended) |
ลบเลขหน้าและข้อความที่ตั้งใจเลียนแบบชื่อเรื่องออกได้แม่นยำที่สุด |
| 80% - 100% |
กรองแบบปลอดภัย (Conservative) |
ลบเฉพาะข้อความที่ "เหมือนเป๊ะ" เท่านั้น ป้องกันเนื้อหาหลักหายได้ดีที่สุด |
3. การประมวลผล (Processing)
- ระบบใช้เทคโนโลยี Thai Word Break เพื่อตัดคำภาษาไทยให้เหมาะสมกับหน้าจอ E-Reader ทุกขนาด
- ไฟล์ที่ได้จะเป็นมาตรฐาน EPUB 3.0 ซึ่งรองรับการเปลี่ยน Font และขนาดอักษรในเครื่องอ่าน