uni2ascii এবং ascii2uni UTF-8 ইউনিকোড এবং সহ 7-বিট ASCII সমকক্ষও বিভিন্ন কারো মধ্যে রূপান্তর: হেক্সাডেসিমেল এবং দশমিক এইচটিএমএল সাংখ্যিক চরিত্র রেফারেন্স খুঁজে পেতে, U-বেরিয়ে, স্ট্যান্ডার্ড হেক্সাডেসিমেল, এবং কাঁচা হেক্সাডেসিমেল.
ইউনিকোড অক্ষর সেট হ্যান্ডেল কিন্তু 8 বিট নিরাপদ নয় পারেন যে ওয়েব প্রোগ্রামের মধ্যে যখন টেক্সট লিখে, এবং ডিবাগ যখন, প্রোগ্রাম উৎস ইউনিকোড টেক্সট সহ যখন যেমন হওয়া ASCII সমকক্ষও উপযোগী.
ইউনিকোড উপলব্ধ পালাতে হয়:
- এইচটিএমএল হেক্সাডেসিমেল সংখ্যা বর্ণনা সম্বন্ধীয় নিয়মাবলী চরিত্র রেফারেন্স (যেমন)
- এইচটিএমএল দশমিক সাংখ্যিক চরিত্র রেফারেন্স (যেমন ȳ)
- U-বেরিয়ে, পাইথন হিসাবে ব্যবহৃত (যেমন u00E9)
- যেমন বিএমপি, তার পরেও BMP এবং ইউ-বেরিয়ে মধ্যে U-বেরিয়ে u00E9 কিন্তু U00010024.
- ইউ -escapes (উদাঃ ইউ 00E9)
- ইউ-বেরিয়ে (উদাঃ U00E9)
- U-বেরিয়ে (উদাঃ u00E9)
- কোণ বন্ধনী মধ্যে ইউ-বেরিয়ে (উদাঃ)
- এক্স-বেরিয়ে (উদাঃ x00E9)
- ধনুর্বন্ধনী সঙ্গে এক্স বেরিয়ে (উদাঃ X {00E9})
- স্ট্যান্ডার্ড হেক্সাডেসিমেল (উদাঃ 0x00E9)
- কাঁচা হেক্সাডেসিমেল (উদাঃ 00E9)
uni2ascii কিছু কিছু প্রোগ্রাম শুধুমাত্র একটি বা অপরকে মেনে নিন থেকে হেক্সাডেসিমেল সংখ্যা হিসাবে AF উপরের কেস এ এফ বা ছোট হাতের উৎপন্ন কিনা তা নির্ধারণের একটি কমান্ড লাইন থেকে ব্যবহারযোগ্য পতাকা গ্রহণ করা হয়. ascii2uni হয় গ্রহণ করা হয়.
ডিফল্টরূপে uni2ascii ক্ষেত্রে, হওয়া ASCII পরিসীমা বাইরে শুধুমাত্র অক্ষর রূপান্তরিত হয়. ASCII অক্ষর পরিবর্তিত হয়, এমনকি যদি তাদের রূপান্তর স্পষ্টভাবে অনুরোধ করা হয়, যদি না, নতুন লাইন সংরক্ষিত হয়. রূপান্তর স্পষ্টভাবে অনুরোধ করা হয়, যদি না শূণ্যস্থান এছাড়াও সংরক্ষিত হয়. শূণ্যস্থান রূপান্তরিত না হলে 7 মধ্যে আউটপুট রাখা যাতে তিন অ হওয়া ASCII শূণ্যস্থান (ইথিওপিয় শব্দ স্থান, ওঘাম স্থান, এবং চিত্রলিপি স্থান) এর ক্ষেত্রে, এই ASCII স্থান (0x20) সঙ্গে প্রতিস্থাপিত হয় বিট ASCII পরিসীমা.
এই প্যাকেজটি চার প্রোগ্রাম রয়েছে. প্রধান প্রোগ্রাম uni2ascii হয়. এটা সি লিখিত হয় এবং কম্পাইল করা আবশ্যক. uni2html.py uni2ascii যাও পূর্বসুরী হয়. এটা পাইথন য়েমন লেখা আছে, এটা কম্পাইল করা দরকার হয় না এবং ঠিক কোন বর্তমান কম্পিউটার সম্পর্কে উপর চালানো উচিত. uni2ascii যে অন্যথায় শ্রেয়:
- এটা আউটপুট বিন্যাসের একটি বৃহত্তর পরিসর তৈরি করে.
- এটা প্রায় 20 গুণ দ্রুত হয়.
- এটা সম্পূর্ণ 32 বিট ইউনিকোড সীমার মধ্যে ইনপুট পরিচালনা করা. বিপরীতভাবে, uni2html শুধুমাত্র হ্যান্ডলগুলি
বেসিক বহুভাষিক প্লেন কারণ বর্তমান পাইথন এ (প্লেন 0) অন্ত 16 বিট ইন্টিজার ব্যবহার ইউনিকোড এনকোডেড টেক্সট প্রতিনিধিত্ব করে. আপনি লিনিয়ার বি বা উগারিটিক, বলুন, টেক্সট পেয়েছেন, আপনি uni2ascii প্রয়োজন.
এটা ত্রুটি রিপোর্ট করার একটি ভালো কাজ আছে. ম্যাল গঠিত UTF-8, এটা ফাইলের শুরুতে থেকে অক্ষর গণনা (0 থেকে শুরু) পদ এবং বাইট গণনা পরিপ্রেক্ষিতে উভয় ত্রুটি অবস্থান রিপোর্ট যেমন এটা তার ইনপুট একটি ত্রুটি, সম্মুখীন হলে ফাইলের শুরুতে থেকে (এছাড়াও প্রারম্ভ 0). (একটি UTF-8 এনকোড চরিত্র এক থেকে চার বাইট থেকে দখল করে থেকে অক্ষর এবং সংখ্যা এবং বাইট সংখ্যা সাধারণত একই নয়.) পাইথন সংস্করণ রিপোর্ট শুধুমাত্র অক্ষর গণনা. uni2ascii ত্রুটির প্রকৃতি সম্পর্কে তথ্য প্রদান করে.
তৃতীয় প্রোগ্রাম, ascii2uni, uni2ascii এর বিপরীত হয়. এটা ইউনিকোড অক্ষর এর ASCII উপস্থাপনা বিভিন্ন ধারণকারী টেক্সট গ্রহণ এবং UTF-8 ইউনিকোড নির্মাণ করা সম্ভব.
চতুর্থ প্রোগ্রাম, ascii2uni.py ধারণকারী 7-বিট ASCII সার্চ U-পলান পাইথন এবং Tcl ব্যবহৃত, এবং UTF-8 ইউনিকোড তা পরিবর্তিত হিসাবে, ইউনিকোড. এটা ascii2uni একটি সামান্যীকরণ যা মূল প্রোগ্রাম
এই রিলিজে নতুন কি:. Uni2ascii মধ্যে
- স্থায়ী বাগ কতিপয় ক্ষেত্রে যা subsitution গণনা ডেবিয়ান বাগ # 626268 স্থাপন, খুব বেশী ছিল.
- কাছের ASCII সমতুল্য নিম্নলিখিত ধর্মান্তর uni2ascii যোগ করা হয়েছে: ইউ newline করতে সময়ের 'O', u + 00B7 মাঝখানে বিন্দু, newline করতে u + 0085 পরের লাইন, u + 2028 লাইন বিভাজক +2022 বুলেট.
- প্রশ্ন বিন্যাসে ascii2uni আবার কাজ .
- নতুন নামকরন করা হয় endian.h সঙ্গে সংঘাতে বাছা u2a_endian.h করতে বহিরাগত endian.h.
- প্রশ্ন বিন্যাসে ব্যবহার সঙ্গে হস্তক্ষেপের যে একটি বাগ সংশোধন করা হয়েছে uni2ascii. মধ্যে
- স্থায়ী বাগ রিপোর্ট করা.
- উভয় প্রোগ্রাম এখন অনুমতি ইনপুট ফাইল নাম চিহ্নিত করা ফেরৎ ছাড়া কমান্ড লাইন থেকে ব্যবহারযোগ্য.
- এই রিলিজে জন্য সমর্থন যোগ করা হয়েছে করুন & lt; এক্সএক্স ও gt; & lt; এক্সএক্স & gt; এবং% uXXXX ফরম্যাটের.
- এই রিলিজে ওয়াই যুক্তি যে একটি বাগ সংশোধন করা হয়েছে -a ascii2uni কোন সমিতি এর পতাকা এবং man পৃষ্ঠা সংশোধন এবং উভয় প্রোগ্রামের জন্য -a পতাকা Y ও প্রশ্ন আর্গুমেন্ট জন্য সাহায্য.
<লি> getline অভাব আছে যা NetBSD বা পরিস্থিতি হ্যান্ডেল Patched.
<লি> স্থান এবং newline ছাড়া অন্য ASCII সীমার মধ্যে অক্ষর রূপান্তর হিসেবে বিশুদ্ধ বিকল্প শব্দার্থবিদ্যা ব্যাখ্যা. স্থায়ী বাগ যা এই UTF8 ধরনের জন্য সঠিকভাবে বাস্তবায়ন করা হয়নি.
সংস্করণ 4.17 নতুন কি:
সংস্করণ 4.16 নতুন কি:
<লি> যোগ করা হয়েছে u + 2033 ডবল প্রধানমন্ত্রী uni2ascii ই ফরম্যাট ব্যবহার করে অধীনে তাদের নিকটস্থ ASCII সমতুল্য রূপান্তরিত অক্ষর.
সংস্করণ 4.15 নতুন কি
<লি> এটা POSIX2008 হিসাবে স্ট্যান্ডার্ড হিসাবে ascii2uni.c থেকে গনুহ getline এর সরানো হয়েছে কপি.
কি সংস্করণ 4.14 নতুন:
<লি> স্থায়ী বাগ + + 2502 ইউ এবং u + 2503 এর যা ascification আউটপুট ডবল উদ্ধৃতি যোগ.
<লি> একটি বাগ সংশোধন করা যা এর বিকল্প উত্পন্ন -a একটি & quot; তাই অনেক অক্ষর করুন & quot রূপান্তরিত; কারণে ডিবাগ কোড যাব প্রতিটি অক্ষরের জন্য লাইন.
সংস্করণ 4.13 নতুন কি:
অক্ষরের অত্যধিক সংখ্যা হওয়া ASCII পরিবর্তন সৃষ্টিকারী
কি সংস্করণ 4.12 নতুন:
কি সংস্করণ 4.11 নতুন:
কি সংস্করণ 4.10 নতুন:
<লি> ওয়াই যুক্তি এখন uni2ascii জন্য একটি ত্রুটি.
<লি> সংস্করণ সংক্রান্ত তথ্য এবং কর্ম সারসংক্ষেপ আরো তথ্যপূর্ণ.
পাওয়া মন্তব্যসমূহ না