এ এ্যাপাচি Tika অন্যান্য ফাইল ভিতরে কন্টেন্ট অনুসন্ধানের জন্য একটি নিম্ন স্তরের টুলকিট হিসাবে উন্নত ছিল.
টিকা নিজস্ব একটি সহজ লাইব্রেরি হচ্ছে বেশি কিছু না, কিন্তু এটি একটি সম্পূর্ণ ক্রিয়ামূলক ইন ফাইল সার্চ সিস্টেম প্রদান সার্চ ইঞ্জিন, ডিজিটাল অ্যাসেট ম্যানেজমেন্ট সিস্টেম বা সিএমএস মত আরো শক্তিশালী সরঞ্জাম একত্রিত করা যেতে পারে.
গ্রন্থাগারের দ্রুত সামগ্রিক ফাইলের তথ্যের জন্য শুধু ফাইল এর হেডার অ্যাক্সেস করতে পারেন, অথবা এটি সত্যিই গভীর যান এবং টেক্সট বা বাইনারি বিন্যাসে, তথ্য বিভিন্ন ধরনের ফাইল শরীরে এমনকি অনুসন্ধান করতে পারেন.
ফাইল ধরনের একটি বিস্তৃত সমর্থিত এবং Tika এছাড়াও তৃতীয় পক্ষের বাইন্ডিং এবং চাদরে সিরিজের অন্যান্য প্রোগ্রামিং ভাষা ধন্যবাদ সাথে ব্যবহার করা যেতে পারে.
এই রিলিজে নতুন কি
- এই রিলিজে বাগ সংশোধন করা হয়েছে এবং একটি নতুন টেসেরাক্ত OCR পার্সার সহ নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.
- এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.
- এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.
- এই রিলিজে একটি নতুন অনুবাদ সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে এপিআই, আরো সমর্থিত বিন্যাসের, এবং Tika স্থিতিশীলতার মধ্যে সার্বিক উন্নতি.
- প্রতিটি PDF ফাইলের শেষে এমবেড ফাইল প্রক্রিয়াকরণের হ্যান্ডলিং মধ্যে স্থায়ী বাগ
- একটি দুর্বল নির্বাচিত জিপিএল টেক্সট সঙ্গে একটি পরীক্ষা এইচটিএমএল ফাইলে অপসারিত এটা.
Tika-সার্ভারে <লি> উন্নতি এটি টেক্সট / এইচটিএমএল ও টেক্সট / XML বিষয়বস্তু তৈরী করার অনুমতি দেয়.
<লি> উন্নতি সত্যতে সেট decompressConcatenated বিকল্প প্রয়োজন যে g'zipped ফাইল হ্যান্ডেল কম্প্রেসার parser থেকে তৈরি করা হয়েছে.
<লি> বাঙালীরা ফাইল সনাক্তকরণ থেকে প্রতিরোধ ছিল একটি মুদ্রণ ত্রুটি ঠিকানাসংবলিত. - এ্যাপাচি Tika 1.2 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.
- এ্যাপাচি Tika 1.0 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.
- এই রিলিজে বেশ কিছু গুরুত্বপূর্ণ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে
- ভাষা সনাক্তকারী এখন একটি কনফিগ ফাইল মাধ্যমে পরিবর্তনশীল, কনফিগার পরিচালিত হয় ক্লাসপাথ থেকে লোড.
<লি> Tika এখন পার্সিং অন্তর্নিহিত রোম লাইব্রেরি মোড়কে ফীড সমর্থন করে.
<লি> Tika পার্সিং জন্য একটি দ্রুত শুরু গাইড অবদান ছিল.
<লি> এক্সএইচটিএমএল বৈশিষ্ট্যাবলী মাধ্যমে নদীর জন্য একটি পন্থা যোগ করা হয়েছিল.
একটি প্রদত্ত ইনপুট ডকুমেন্ট জন্য শ্রেষ্ঠ পার্সার নির্বাচনের সময় <লি> মিডিয়া টাইপ অনুক্রমের তথ্য এখন বিবেচনায় নেয়া হয়.
<লি> netCDF এবং HDF4 / 5 যোগ করা হয়েছিল সহ সাধারণ বৈজ্ঞানিক তথ্য ফরম্যাটের পার্সিং জন্য সমর্থন.
উইন্ডোজের জন্য <লি> ইউনিট পরীক্ষা TestParsers সম্পন্ন করতে সক্ষম হবেন, সংশোধন করা হয়েছে. - MP3 ফাইল পার্সিং চ্যানেল ও স্যাম্পলরেট নিষ্কাশন সহ উন্নত করা হয় এবং ID3v2 সমর্থন. উপরন্তু, অডিও পার্সিং MIME সনাক্তকরণ এখন MIDI বিন্যাস জন্য উন্নত ছিল.
<লি> Tika আর তার RTF পরস্পরের পার্সিং কার্যকারিতার জন্য X11 উপর নির্ভর করে.
<লি> AutoDetectParser একটি থ্রেড-নিরাপদ বাগ আবিষ্কার করেন এবং বক্তৃতা করেন.
<লি> PDFBox 1.0.0 আপগ্রেড করুন. নতুন PDFBox সংস্করণ পিডিএফ পার্সিং কর্মক্ষমতা বৃদ্ধি ও লেখা নিষ্কাশন বিষয় একটি নম্বর সমাধান করা হয়েছে. - জাভা 6 বা উচ্চতর করুন
আপনি কি সংস্করণ 1.8 এ নতুন:
আপনি কি সংস্করণ 1.7 এ নতুন:
আপনি কি সংস্করণ 1.6 এ নতুন:
আপনি কি সংস্করণ 1.5 এ নতুন:.
<লি> যোগ SourceCodeParser জাভা সমর্থন, খাঁজকাটা, সি ++ ফাইল.
<লি> Tika সার্ভার একাধিক / ফরম-তথ্য প্লেলোডগুলির সমর্থন আপডেট করা হয়েছে.
CXF 2.7.8 করতে <লি> আপডেট Tika সার্ভার.
<লি> আপডেট Tika সার্ভার ওয়াইল্ডকার্ড অ্যাড্রেস ধরে অনুরোধ গ্রহণ করতে.
<লি> বিকল্প NonSequentialPDFParser ব্যবহার করার অপশন যোগ করা হয়েছে.
<লি> পিডিএফ AcroForms থেকে কনটেন্ট এখন আহরণ করা হয়.
<লি> পিপিটি মাস্টার স্লাইড থেকে স্থায়ী অবৈধ আস্টেরিক্স.
<লি> যোগ পরীক্ষার ক্ষেত্রে PPT এবং pptx মধ্যে অটো-তারিখ সামলাচ্ছে জ্ঞাপন করুন.
সংস্করণ 1.4 নতুন আপনি কি:
সংস্করণ 1.2 নতুন আপনি কি:
সংস্করণ 1.0 নতুন আপনি কি:
আপনি কি সংস্করণ 0.9 এ নতুন:.
আপনি কি সংস্করণ 0.8 এ নতুন:
আপনি কি সংস্করণ 0.7 এ নতুন:
আবশ্যক :
পাওয়া মন্তব্যসমূহ না