อินพุต

IN
อินพุต
0 ตัวอักษร

เอาต์พุต

OUT
เอาต์พุต
0 ตัวอักษร

เกี่ยวกับการเข้ารหัส UTF-8

UTF-8 (Unicode Transformation Format - 8-bit) เป็นการเข้ารหัสอักขระแบบความกว้างผันแปรที่ใช้ 1-4 ไบต์ต่ออักขระ เข้ากันได้ย้อนหลังกับ ASCII และเป็นการเข้ารหัสหลักบนเว็บ ต่างจากการแสดง Unicode code points เครื่องมือนี้แสดงค่าไบต์ UTF-8 จริง — ไบต์จริงที่จัดเก็บในหน่วยความจำและส่งผ่านเครือข่าย

การเข้ารหัสไบต์ UTF-8 จริง
รองรับ Unicode & อิโมจิ
รูปแบบทศนิยม & ฐานสิบหก
ติดตามจำนวนไบต์แบบสด

คู่มือฉบับสมบูรณ์สำหรับการเข้ารหัส UTF-8

เครื่องมือแปลงข้อความเป็นไบต์ UTF-8 ออนไลน์ฟรี

แปลงข้อความเป็นค่าไบต์ UTF-8 จริงหรือถอดรหัสไบต์ UTF-8 กลับเป็นข้อความทันที เครื่องมือนี้แสดงไบต์จริงที่คอมพิวเตอร์ใช้จัดเก็บและส่งข้อความ — ไม่ใช่แค่ code points เหมาะสำหรับนักพัฒนา วิศวกรเครือข่าย และทุกคนที่ดีบักปัญหาการเข้ารหัสอักขระ

คุณสมบัติหลัก

🔐 การเข้ารหัสข้อความเป็น UTF-8

  • แปลงข้อความใด ๆ เป็นไบต์ UTF-8
  • รองรับอักขระ Unicode เต็มรูปแบบ
  • จัดการอิโมจิและสัญลักษณ์พิเศษ
  • แปลงแบบเรียลไทม์ขณะพิมพ์
  • เอาต์พุตไบต์ทศนิยมและ hex

🔓 การถอดรหัส UTF-8 เป็นข้อความ

  • ถอดรหัสไบต์ UTF-8 เป็นข้อความที่อ่านได้
  • ตรวจสอบลำดับไบต์
  • ตรวจจับข้อผิดพลาด & ข้อความแจ้ง
  • จัดการตัวคั่นช่องว่าง/จุลภาค
  • รองรับอินพุต hex (รูปแบบ 0xFF)

การประมวลผลแบบเรียลไทม์

  • แปลงทันทีเมื่อป้อนข้อมูล
  • ดีเลย์ 300ms เพื่อประสิทธิภาพ
  • แสดงจำนวนไบต์แบบสด
  • ไม่ต้องคลิกปุ่ม

💾 ตัวเลือกการส่งออก

  • ดาวน์โหลดเป็นไฟล์ .txt
  • ส่งออกเป็นไฟล์ .html
  • บันทึกเป็นรูปแบบ .json
  • คัดลอกไปยังคลิปบอร์ดด้วยคลิกเดียว

UTF-8 คืออะไร?

UTF-8 (Unicode Transformation Format - 8-bit) เป็นการเข้ารหัสอักขระแบบความกว้างผันแปรที่สามารถแสดงอักขระทุกตัวในมาตรฐาน Unicode เข้ากันได้ย้อนหลังกับ ASCII (128 อักขระแรกเหมือนกัน) และใช้ 1-4 ไบต์ต่ออักขระ UTF-8 เป็นการเข้ารหัสอักขระหลักบนเว็บในปัจจุบันและรองรับทุกภาษา สัญลักษณ์ และอิโมจิ

ช่วงไบต์ UTF-8:

1 ไบต์ (0x00-0x7F): อักขระ ASCII พื้นฐาน (A, B, 0-9 ฯลฯ)

2 ไบต์ (0xC0-0xDF + 0x80-0xBF): Latin ขยาย, กรีก, ซีริลลิก, อาหรับ, ฮีบรู

3 ไบต์ (0xE0-0xEF + 2×0x80-0xBF): ภาษาเอเชียส่วนใหญ่ (จีน, ญี่ปุ่น, เกาหลี), สัญลักษณ์

4 ไบต์ (0xF0-0xF7 + 3×0x80-0xBF): ภาษาหายาก, สัญลักษณ์ดนตรี, อิโมจิ

UTF-8 เปรียบเทียบกับ Code Points

เครื่องมือหลายตัวอ้างว่าแสดง "UTF-8" แต่จริง ๆ แล้วแสดง Unicode code points (ตัวเลขนามธรรมที่กำหนดให้แต่ละอักขระ) เครื่องมือนี้แสดงไบต์ UTF-8 จริง — ข้อมูลจริงที่จัดเก็บในไฟล์และส่งผ่านเครือข่าย นี่คือความแตกต่าง:

ตัวอย่าง: "€" (เครื่องหมายยูโร)

Code point: U+20AC (ทศนิยม: 8364) — หนึ่งตัวเลข

ไบต์ UTF-8: 0xE2 0x82 0xAC (ทศนิยม: 226 130 172) — สามไบต์

ตัวอย่าง: "😀" (หน้ายิ้ม)

Code point: U+1F600 (ทศนิยม: 128512) — หนึ่งตัวเลข

ไบต์ UTF-8: 0xF0 0x9F 0x98 0x80 (ทศนิยม: 240 159 152 128) — สี่ไบต์

การเข้ารหัส UTF-8 ทำงานอย่างไร

  1. อักขระ ASCII (U+0000 ถึง U+007F): เข้ารหัสเป็นไบต์เดียว เหมือนกับ ASCII ตัวอย่าง: 'A' → 0x41
  2. อักขระ 2 ไบต์ (U+0080 ถึง U+07FF): ไบต์แรกเริ่มด้วย 110xxxxx ไบต์ที่สองด้วย 10xxxxxx ตัวอย่าง: 'é' → 0xC3 0xA9
  3. อักขระ 3 ไบต์ (U+0800 ถึง U+FFFF): ไบต์แรกเริ่มด้วย 1110xxxx ตามด้วยไบต์ 10xxxxxx สองตัว ตัวอย่าง: '€' → 0xE2 0x82 0xAC
  4. อักขระ 4 ไบต์ (U+10000 ถึง U+10FFFF): ไบต์แรกเริ่มด้วย 11110xxx ตามด้วยไบต์ 10xxxxxx สามตัว ตัวอย่าง: '😀' → 0xF0 0x9F 0x98 0x80

กรณีการใช้งานทั่วไป

การดีบักปัญหาการเข้ารหัส: ดูไบต์จริงที่จัดเก็บในไฟล์เพื่อวินิจฉัย mojibake ข้อความเพี้ยน หรือการเข้ารหัสไม่ตรงกัน

การวิเคราะห์เครือข่าย: ตรวจสอบว่าข้อความถูกเข้ารหัสอย่างไรเมื่อส่งผ่าน HTTP, WebSocket หรือโปรโตคอลอื่น

การดีบักฐานข้อมูล: ตรวจสอบลำดับไบต์ UTF-8 ที่จัดเก็บในฐานข้อมูลเพื่อแก้ไขปัญหาชุดอักขระ

การศึกษา: เรียนรู้วิธีการทำงานของการเข้ารหัส UTF-8 ในระดับไบต์และทำความเข้าใจการเข้ารหัสแบบความกว้างผันแปร

การวิเคราะห์ไฟล์: ทำความเข้าใจวิธีที่โปรแกรมแก้ไขข้อความและระบบจัดเก็บอักขระในไฟล์ที่เข้ารหัส UTF-8

อ้างอิงด่วน: ตัวอย่างไบต์ UTF-8

อักขระไบต์ UTF-8 (Hex)จำนวนไบต์
A411 ไบต์
éC3 A92 ไบต์
E2 82 AC3 ไบต์
E4 B8 AD3 ไบต์
😀F0 9F 98 804 ไบต์
🌍F0 9F 8C 8D4 ไบต์

ตัวอย่างการเขียนโปรแกรม

รับไบต์ UTF-8 ในภาษาต่าง ๆ:

JavaScript:

new TextEncoder().encode('€') // Uint8Array [226, 130, 172]
new TextDecoder().decode(new Uint8Array([226, 130, 172])) // '€'

Python:

'€'.encode('utf-8') # b'\xe2\x82\xac'
b'\xe2\x82\xac'.decode('utf-8') # '€'

Java:

"€".getBytes(StandardCharsets.UTF_8) // [-30, -126, -84] (signed)
new String(bytes, StandardCharsets.UTF_8) // "€"

🔒 รับประกันความเป็นส่วนตัว 100%

การเข้ารหัสและถอดรหัส UTF-8 ทั้งหมดดำเนินการในเว็บเบราว์เซอร์ของคุณโดยใช้ JavaScript ข้อความและข้อมูลของคุณไม่เคยออกจากอุปกรณ์ - ไม่มีอะไรถูกอัปโหลดไปยังเซิร์ฟเวอร์ จัดเก็บในฐานข้อมูล บันทึก หรือส่งไปยังบุคคลที่สาม ความเป็นส่วนตัวและความปลอดภัยอย่างสมบูรณ์สำหรับการแปลงทั้งหมดของคุณ

เรียนรู้เพิ่มเติมเกี่ยวกับ UTF-8

ต้องการทำความเข้าใจวิธีการทำงานของการเข้ารหัส UTF-8 เบื้องหลัง? อ่านคู่มือเชิงลึกของเราที่ครอบคลุมการเข้ารหัสแบบความกว้างผันแปร รูปแบบไบต์ ตัวอย่างการเข้ารหัสทีละขั้นตอน และแนวปฏิบัติที่ดีที่สุด

อ่าน: UTF-8 คืออะไร?

เครื่องมือเข้ารหัส & ข้อความที่เกี่ยวข้อง