cpdetector প্রকল্প Codepage সনাক্তকরণের জন্য একটি ছোট এখনো চতুর কাঠামো হয়.
cpdetector বিভিন্ন কৌশল সংহত করে Codepage সনাক্তকরণের জন্য একটি ছোট এখনো চতুর কাঠামো হয়. এটা নেটওয়ার্কের মাধ্যমে পাঠগত তথ্য ব্যবহারের যে তৃতীয় পক্ষের সফ্টওয়্যার জন্য একটি লাইব্রেরি হিসাবে ব্যবহার করা যেতে পারে.
এটি বাছাই এবং তাদের Codepage উপর ভিত্তি করে নথি বিশাল সংগ্রহের রূপান্তর করতে পারবেন যে একটি কমান্ড লাইন টুল আকারে একটি সেরা-অনুশীলন বাস্তবায়ন করা হয়েছে.
পাওয়া যায় কৌশল হল: এক্সএমএল এনকোডিং ঘোষণা jchardet (বর্জন, ফ্রিকোয়েন্সি বিশ্লেষণ, এবং মনন), এইচটিএমএল অক্ষরসেট সম্পত্তি সনাক্তকরণ, এবং সনাক্তকরণ.
একটি কোড পাতা কি?
প্রথম, একটি পাঠগত নথি বিট ক্রমের ছাড়া আর কিছুই না. একটি কম্পিউটার তিনি (সংখ্যা হিসাবে কম্পিউটার দ্বারা চিহ্নিত করা হয়) অক্ষর আকারে এই তথ্য প্রদর্শন করতে পারেন, কিভাবে সিদ্ধান্ত নিতে হবে.
একটি কোড পাতা - এছাড়াও অক্ষরসেট এনকোডিং হিসাবে পরিচিত হয় - যা অক্ষর একটি টেক্সচুয়াল নথি কাঁচা তথ্য মানচিত্র. উদাহরণস্বরূপ মূল ASCII কোড পৃষ্ঠা শুধুমাত্র শুধুমাত্র 128 বিভিন্ন অক্ষর মানচিত্র, যার ফলে এইভাবে প্রতিনিধিত্ব করা হয় যে চরিত্র সিদ্ধান্ত নেওয়ার জন্য একটি অষ্টক (বাইট) 7 বিট ব্যবহার করে. গত মেমরি ব্যয়বহুল ছিল এবং কম্পিউটার প্রায়শই মাত্র 8 বিট জন্য নিবন্ধনের এবং ফেরিঘাট ছিল.
একটি মেইনফ্রেম ভাবা হয়, তখন তা সমর্থন করা উচিত, যা অক্ষর, সিদ্ধান্ত নিয়েছে করা হবে. উদাহরণস্বরূপ চিকিৎসক ও গণিতবিদ সমীকরণ জন্য বিশেষ অক্ষর প্রয়োজন. এর ফলে, একটি কম্পিউটার প্রায়ই একটি বিশেষ Codepage সঙ্গে জাহাজে
এই রিলিজে নতুন কি:.
- এই প্রধান Bugfix সংস্করণ কমান্ড-লাইন ব্যাচ মোডে দুই সমস্যা সমাধান করা হয়েছে.
- চলন্ত ধরা পড়েনি নথি থামিয়া সুইচ আবার এখন কাজ করে.
- কোন প্রচেষ্টা (আধুনিক ব্যতিক্রমী প্রোগ্রাম প্রবাহ ঘটিত) ধরা পড়েনি নথি ট্রান্সকোড করা হবে.
কি সংস্করণ 1.0.8 নতুন:
- এই রিলিজে একটি স্থায়িত্ব রিলিজ এবং সংশোধন করা হয়েছে বাইট OpenJDK- র সঙ্গে চিহ্ন সনাক্তকরণ এবং অসঙ্গতি অর্ডার. এটি এখন জাভা 1.5 প্রয়োজন.
পাওয়া মন্তব্যসমূহ না