อินพุต
เอาต์พุต
เกี่ยวกับการเข้ารหัส UTF-8
UTF-8 (Unicode Transformation Format - 8-bit) เป็นการเข้ารหัสอักขระแบบความกว้างผันแปรที่ใช้ 1-4 ไบต์ต่ออักขระ เข้ากันได้ย้อนหลังกับ ASCII และเป็นการเข้ารหัสหลักบนเว็บ ต่างจากการแสดง Unicode code points เครื่องมือนี้แสดงค่าไบต์ UTF-8 จริง — ไบต์จริงที่จัดเก็บในหน่วยความจำและส่งผ่านเครือข่าย
คู่มือฉบับสมบูรณ์สำหรับการเข้ารหัส UTF-8
เครื่องมือแปลงข้อความเป็นไบต์ UTF-8 ออนไลน์ฟรี
แปลงข้อความเป็นค่าไบต์ UTF-8 จริงหรือถอดรหัสไบต์ UTF-8 กลับเป็นข้อความทันที เครื่องมือนี้แสดงไบต์จริงที่คอมพิวเตอร์ใช้จัดเก็บและส่งข้อความ — ไม่ใช่แค่ code points เหมาะสำหรับนักพัฒนา วิศวกรเครือข่าย และทุกคนที่ดีบักปัญหาการเข้ารหัสอักขระ
คุณสมบัติหลัก
🔐 การเข้ารหัสข้อความเป็น UTF-8
- แปลงข้อความใด ๆ เป็นไบต์ UTF-8
- รองรับอักขระ Unicode เต็มรูปแบบ
- จัดการอิโมจิและสัญลักษณ์พิเศษ
- แปลงแบบเรียลไทม์ขณะพิมพ์
- เอาต์พุตไบต์ทศนิยมและ hex
🔓 การถอดรหัส UTF-8 เป็นข้อความ
- ถอดรหัสไบต์ UTF-8 เป็นข้อความที่อ่านได้
- ตรวจสอบลำดับไบต์
- ตรวจจับข้อผิดพลาด & ข้อความแจ้ง
- จัดการตัวคั่นช่องว่าง/จุลภาค
- รองรับอินพุต hex (รูปแบบ 0xFF)
⚡ การประมวลผลแบบเรียลไทม์
- แปลงทันทีเมื่อป้อนข้อมูล
- ดีเลย์ 300ms เพื่อประสิทธิภาพ
- แสดงจำนวนไบต์แบบสด
- ไม่ต้องคลิกปุ่ม
💾 ตัวเลือกการส่งออก
- ดาวน์โหลดเป็นไฟล์ .txt
- ส่งออกเป็นไฟล์ .html
- บันทึกเป็นรูปแบบ .json
- คัดลอกไปยังคลิปบอร์ดด้วยคลิกเดียว
UTF-8 คืออะไร?
UTF-8 (Unicode Transformation Format - 8-bit) เป็นการเข้ารหัสอักขระแบบความกว้างผันแปรที่สามารถแสดงอักขระทุกตัวในมาตรฐาน Unicode เข้ากันได้ย้อนหลังกับ ASCII (128 อักขระแรกเหมือนกัน) และใช้ 1-4 ไบต์ต่ออักขระ UTF-8 เป็นการเข้ารหัสอักขระหลักบนเว็บในปัจจุบันและรองรับทุกภาษา สัญลักษณ์ และอิโมจิ
ช่วงไบต์ UTF-8:
1 ไบต์ (0x00-0x7F): อักขระ ASCII พื้นฐาน (A, B, 0-9 ฯลฯ)
2 ไบต์ (0xC0-0xDF + 0x80-0xBF): Latin ขยาย, กรีก, ซีริลลิก, อาหรับ, ฮีบรู
3 ไบต์ (0xE0-0xEF + 2×0x80-0xBF): ภาษาเอเชียส่วนใหญ่ (จีน, ญี่ปุ่น, เกาหลี), สัญลักษณ์
4 ไบต์ (0xF0-0xF7 + 3×0x80-0xBF): ภาษาหายาก, สัญลักษณ์ดนตรี, อิโมจิ
UTF-8 เปรียบเทียบกับ Code Points
เครื่องมือหลายตัวอ้างว่าแสดง "UTF-8" แต่จริง ๆ แล้วแสดง Unicode code points (ตัวเลขนามธรรมที่กำหนดให้แต่ละอักขระ) เครื่องมือนี้แสดงไบต์ UTF-8 จริง — ข้อมูลจริงที่จัดเก็บในไฟล์และส่งผ่านเครือข่าย นี่คือความแตกต่าง:
ตัวอย่าง: "€" (เครื่องหมายยูโร)
Code point: U+20AC (ทศนิยม: 8364) — หนึ่งตัวเลข
ไบต์ UTF-8: 0xE2 0x82 0xAC (ทศนิยม: 226 130 172) — สามไบต์
ตัวอย่าง: "😀" (หน้ายิ้ม)
Code point: U+1F600 (ทศนิยม: 128512) — หนึ่งตัวเลข
ไบต์ UTF-8: 0xF0 0x9F 0x98 0x80 (ทศนิยม: 240 159 152 128) — สี่ไบต์
การเข้ารหัส UTF-8 ทำงานอย่างไร
- อักขระ ASCII (U+0000 ถึง U+007F): เข้ารหัสเป็นไบต์เดียว เหมือนกับ ASCII ตัวอย่าง: 'A' → 0x41
- อักขระ 2 ไบต์ (U+0080 ถึง U+07FF): ไบต์แรกเริ่มด้วย 110xxxxx ไบต์ที่สองด้วย 10xxxxxx ตัวอย่าง: 'é' → 0xC3 0xA9
- อักขระ 3 ไบต์ (U+0800 ถึง U+FFFF): ไบต์แรกเริ่มด้วย 1110xxxx ตามด้วยไบต์ 10xxxxxx สองตัว ตัวอย่าง: '€' → 0xE2 0x82 0xAC
- อักขระ 4 ไบต์ (U+10000 ถึง U+10FFFF): ไบต์แรกเริ่มด้วย 11110xxx ตามด้วยไบต์ 10xxxxxx สามตัว ตัวอย่าง: '😀' → 0xF0 0x9F 0x98 0x80
กรณีการใช้งานทั่วไป
การดีบักปัญหาการเข้ารหัส: ดูไบต์จริงที่จัดเก็บในไฟล์เพื่อวินิจฉัย mojibake ข้อความเพี้ยน หรือการเข้ารหัสไม่ตรงกัน
การวิเคราะห์เครือข่าย: ตรวจสอบว่าข้อความถูกเข้ารหัสอย่างไรเมื่อส่งผ่าน HTTP, WebSocket หรือโปรโตคอลอื่น
การดีบักฐานข้อมูล: ตรวจสอบลำดับไบต์ UTF-8 ที่จัดเก็บในฐานข้อมูลเพื่อแก้ไขปัญหาชุดอักขระ
การศึกษา: เรียนรู้วิธีการทำงานของการเข้ารหัส UTF-8 ในระดับไบต์และทำความเข้าใจการเข้ารหัสแบบความกว้างผันแปร
การวิเคราะห์ไฟล์: ทำความเข้าใจวิธีที่โปรแกรมแก้ไขข้อความและระบบจัดเก็บอักขระในไฟล์ที่เข้ารหัส UTF-8
อ้างอิงด่วน: ตัวอย่างไบต์ UTF-8
ตัวอย่างการเขียนโปรแกรม
รับไบต์ UTF-8 ในภาษาต่าง ๆ:
JavaScript:
new TextEncoder().encode('€') // Uint8Array [226, 130, 172]
new TextDecoder().decode(new Uint8Array([226, 130, 172])) // '€'Python:
'€'.encode('utf-8') # b'\xe2\x82\xac'
b'\xe2\x82\xac'.decode('utf-8') # '€'Java:
"€".getBytes(StandardCharsets.UTF_8) // [-30, -126, -84] (signed)
new String(bytes, StandardCharsets.UTF_8) // "€"🔒 รับประกันความเป็นส่วนตัว 100%
การเข้ารหัสและถอดรหัส UTF-8 ทั้งหมดดำเนินการในเว็บเบราว์เซอร์ของคุณโดยใช้ JavaScript ข้อความและข้อมูลของคุณไม่เคยออกจากอุปกรณ์ - ไม่มีอะไรถูกอัปโหลดไปยังเซิร์ฟเวอร์ จัดเก็บในฐานข้อมูล บันทึก หรือส่งไปยังบุคคลที่สาม ความเป็นส่วนตัวและความปลอดภัยอย่างสมบูรณ์สำหรับการแปลงทั้งหมดของคุณ
เรียนรู้เพิ่มเติมเกี่ยวกับ UTF-8
ต้องการทำความเข้าใจวิธีการทำงานของการเข้ารหัส UTF-8 เบื้องหลัง? อ่านคู่มือเชิงลึกของเราที่ครอบคลุมการเข้ารหัสแบบความกว้างผันแปร รูปแบบไบต์ ตัวอย่างการเข้ารหัสทีละขั้นตอน และแนวปฏิบัติที่ดีที่สุด
อ่าน: UTF-8 คืออะไร?เครื่องมือเข้ารหัส & ข้อความที่เกี่ยวข้อง
ตัวแปลง ASCII
แปลงข้อความเป็นรหัสอักขระ ASCII (0-127) และถอดรหัสตัวเลข ASCII กลับเป็นข้อความ
ตัวแปลง Hex
แปลงข้อความเป็นเลขฐานสิบหกและ hex เป็นข้อความสำหรับการพัฒนาเว็บและการดีบัก
ตัวเข้ารหัส Base64
เข้ารหัสและถอดรหัสสตริง Base64 สำหรับการส่งข้อมูลและการพัฒนาเว็บ
ตัวเข้ารหัส URL
เข้ารหัสและถอดรหัส URL สำหรับการส่งที่ปลอดภัย จัดการอักขระพิเศษและพารามิเตอร์ query
ตัวแปลงฐาน
แปลงตัวเลขระหว่างระบบเลขฐานสอง ฐานแปด ฐานสิบ และฐานสิบหก
โปรแกรมแก้ไขข้อความ Pro
การแก้ไขข้อความขั้นสูงพร้อมค้นหา/แทนที่ การแก้ไขหลายบรรทัด และเครื่องมือแปลง