UTF8
คือ ชุดอักขระ (Unicode Transformation Format)
หรือ การกำหนดหมายเลขเฉพาะสำหรับทุกอักขระ
โดยไม่ขึ้นกับแพล็ตฟอร์ม ไม่ขึ้นโปรแกรม และคลุมทุกภาษา
นิยมใช้ใน Linux
ซึ่ง UTF8 เป็นชุดอักขระที่เป็นที่รู้จักมากที่สุด
ใช้ 1 ไบต์สำหรับอักขระทุกตัวในรหัสแอสกี
และมีค่ารหัสเหมือนกับมาตรฐานแอสกี
หรือมากกว่านั้นจนถึง 4 ไบต์สำหรับอักขระแบบอื่น
|
UTF16
คือ ชุดอักขระ (Unicode Transformation Format)
หรือ การกำหนดหมายเลขเฉพาะสำหรับทุกอักขระ
โดยไม่ขึ้นกับแพล็ตฟอร์ม ไม่ขึ้นโปรแกรม และคลุมทุกภาษา
นิยมใช้ใน Windows
ซึ่ง UTF16 เป็นส่วนขยายจาก UCS-2
โดยใช้ 4 ไบต์สำหรับแทนรหัสอักขระที่ขาดไปของ UCS-2
|
ASCII
(American Standard Code for Information Interchange)
คือ รหัสที่อเมริกากำหนดขึ้นมา เพื่อใช้ในการแลกเปลี่ยนข้อมูล
ชุดอักขระแอสกี (ASCII character set)
ใช้ในการอ้างอิงว่ารหัสนี้แทนตัวอักษรอะไร
ASCII มีมาตรฐานต่างกันไปตามซอฟต์แวร์
แต่ใช้ 7 bit แรกเป็นรหัสอักษรภาษาอังกฤษเหมือนกัน
ที่เหลือขึ้นกับแต่ละมาตรฐาน
เช่น ตัว A ในภาษาอังกฤษ ถูกแทนด้วย 65 ในฐาน 10
หรือ 41 ในฐาน 16
ซึ่งชุดตัวอักษรของ ASCII แบบ 8 bit ใช้ 1 byte ต่อ 1 character
จึงเก็บอักขระได้ 256 แบบ
ในยุคแรกภาษาไทยใช้ bit ที่ 8 ต่างกันไป
เช่น รหัสเกษตรฯ รหัส สมอ. หรือรหัส MacThai
อ่านเพิ่มเติมที่ มาตรฐานภาษาไทย
|
ANSI
(American National Standards Institute)
คือ สถาบันที่กำหนดมาตรฐาน ได้กำหนดมาตรฐานของตัวอักษร
ในชื่อ ANSI character set ซึ่งกำหนดมาตรฐานไว้ 217 ตัวอักษร
The ANSI set of 217 characters, also known as Windows-1252,
was the standard for the core fonts supplied with US versions of Microsoft Windows up to and including Windows 95 and Windows NT 4.
อ่านเพิ่มเติมที่ มาตรฐานแอนซี่
|
|