Apache Tika

সফটওয়্যার স্ক্রিনশট:
Apache Tika
সফটওয়্যার বিবরণ:
সংস্করণ: 1.9 আপডেট
তারিখ আপলোড: 20 Jul 15
ডেভেলপার: Apache Software Foundation
লাইসেন্স: বিনামূল্যে
জনপ্রিয়তা: 320

Rating: 4.0/5 (Total Votes: 2)

এ এ্যাপাচি Tika অন্যান্য ফাইল ভিতরে কন্টেন্ট অনুসন্ধানের জন্য একটি নিম্ন স্তরের টুলকিট হিসাবে উন্নত ছিল.
টিকা নিজস্ব একটি সহজ লাইব্রেরি হচ্ছে বেশি কিছু না, কিন্তু এটি একটি সম্পূর্ণ ক্রিয়ামূলক ইন ফাইল সার্চ সিস্টেম প্রদান সার্চ ইঞ্জিন, ডিজিটাল অ্যাসেট ম্যানেজমেন্ট সিস্টেম বা সিএমএস মত আরো শক্তিশালী সরঞ্জাম একত্রিত করা যেতে পারে.
গ্রন্থাগারের দ্রুত সামগ্রিক ফাইলের তথ্যের জন্য শুধু ফাইল এর হেডার অ্যাক্সেস করতে পারেন, অথবা এটি সত্যিই গভীর যান এবং টেক্সট বা বাইনারি বিন্যাসে, তথ্য বিভিন্ন ধরনের ফাইল শরীরে এমনকি অনুসন্ধান করতে পারেন.
ফাইল ধরনের একটি বিস্তৃত সমর্থিত এবং Tika এছাড়াও তৃতীয় পক্ষের বাইন্ডিং এবং চাদরে সিরিজের অন্যান্য প্রোগ্রামিং ভাষা ধন্যবাদ সাথে ব্যবহার করা যেতে পারে.

এই রিলিজে নতুন কি

  • এই রিলিজে বাগ সংশোধন করা হয়েছে এবং একটি নতুন টেসেরাক্ত OCR পার্সার সহ নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


  • আপনি কি সংস্করণ 1.8 এ নতুন:

    • এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


    • আপনি কি সংস্করণ 1.7 এ নতুন:

      • এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


      • আপনি কি সংস্করণ 1.6 এ নতুন:

        • এই রিলিজে একটি নতুন অনুবাদ সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে এপিআই, আরো সমর্থিত বিন্যাসের, এবং Tika স্থিতিশীলতার মধ্যে সার্বিক উন্নতি.


        • আপনি কি সংস্করণ 1.5 এ নতুন:.

          • প্রতিটি PDF ফাইলের শেষে এমবেড ফাইল প্রক্রিয়াকরণের হ্যান্ডলিং মধ্যে স্থায়ী বাগ

          • <লি> যোগ SourceCodeParser জাভা সমর্থন, খাঁজকাটা, সি ++ ফাইল.


            <লি> Tika সার্ভার একাধিক / ফরম-তথ্য প্লেলোডগুলির সমর্থন আপডেট করা হয়েছে.


            CXF 2.7.8 করতে <লি> আপডেট Tika সার্ভার.


            <লি> আপডেট Tika সার্ভার ওয়াইল্ডকার্ড অ্যাড্রেস ধরে অনুরোধ গ্রহণ করতে.


            <লি> বিকল্প NonSequentialPDFParser ব্যবহার করার অপশন যোগ করা হয়েছে.


            <লি> পিডিএফ AcroForms থেকে কনটেন্ট এখন আহরণ করা হয়.


            <লি> পিপিটি মাস্টার স্লাইড থেকে স্থায়ী অবৈধ আস্টেরিক্স.


            <লি> যোগ পরীক্ষার ক্ষেত্রে PPT এবং pptx মধ্যে অটো-তারিখ সামলাচ্ছে জ্ঞাপন করুন.


            সংস্করণ 1.4 নতুন আপনি কি:

            • একটি দুর্বল নির্বাচিত জিপিএল টেক্সট সঙ্গে একটি পরীক্ষা এইচটিএমএল ফাইলে অপসারিত এটা.


              Tika-সার্ভারে <লি> উন্নতি এটি টেক্সট / এইচটিএমএল ও টেক্সট / XML বিষয়বস্তু তৈরী করার অনুমতি দেয়.


              <লি> উন্নতি সত্যতে সেট decompressConcatenated বিকল্প প্রয়োজন যে g'zipped ফাইল হ্যান্ডেল কম্প্রেসার parser থেকে তৈরি করা হয়েছে.


              <লি> বাঙালীরা ফাইল সনাক্তকরণ থেকে প্রতিরোধ ছিল একটি মুদ্রণ ত্রুটি ঠিকানাসংবলিত.


            • সংস্করণ 1.2 নতুন আপনি কি:

              • এ্যাপাচি Tika 1.2 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.


              • সংস্করণ 1.0 নতুন আপনি কি:

                • এ্যাপাচি Tika 1.0 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.


                • আপনি কি সংস্করণ 0.9 এ নতুন:.

                  • এই রিলিজে বেশ কিছু গুরুত্বপূর্ণ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে

                  • আপনি কি সংস্করণ 0.8 এ নতুন:

                    • ভাষা সনাক্তকারী এখন একটি কনফিগ ফাইল মাধ্যমে পরিবর্তনশীল, কনফিগার পরিচালিত হয় ক্লাসপাথ থেকে লোড.


                      <লি> Tika এখন পার্সিং অন্তর্নিহিত রোম লাইব্রেরি মোড়কে ফীড সমর্থন করে.


                      <লি> Tika পার্সিং জন্য একটি দ্রুত শুরু গাইড অবদান ছিল.


                      <লি> এক্সএইচটিএমএল বৈশিষ্ট্যাবলী মাধ্যমে নদীর জন্য একটি পন্থা যোগ করা হয়েছিল.


                      একটি প্রদত্ত ইনপুট ডকুমেন্ট জন্য শ্রেষ্ঠ পার্সার নির্বাচনের সময় <লি> মিডিয়া টাইপ অনুক্রমের তথ্য এখন বিবেচনায় নেয়া হয়.


                      <লি> netCDF এবং HDF4 / 5 যোগ করা হয়েছিল সহ সাধারণ বৈজ্ঞানিক তথ্য ফরম্যাটের পার্সিং জন্য সমর্থন.


                      উইন্ডোজের জন্য <লি> ইউনিট পরীক্ষা TestParsers সম্পন্ন করতে সক্ষম হবেন, সংশোধন করা হয়েছে.


                    • আপনি কি সংস্করণ 0.7 এ নতুন:

                      • MP3 ফাইল পার্সিং চ্যানেল ও স্যাম্পলরেট নিষ্কাশন সহ উন্নত করা হয় এবং ID3v2 সমর্থন. উপরন্তু, অডিও পার্সিং MIME সনাক্তকরণ এখন MIDI বিন্যাস জন্য উন্নত ছিল.


                        <লি> Tika আর তার RTF পরস্পরের পার্সিং কার্যকারিতার জন্য X11 উপর নির্ভর করে.


                        <লি> AutoDetectParser একটি থ্রেড-নিরাপদ বাগ আবিষ্কার করেন এবং বক্তৃতা করেন.


                        <লি> PDFBox 1.0.0 আপগ্রেড করুন. নতুন PDFBox সংস্করণ পিডিএফ পার্সিং কর্মক্ষমতা বৃদ্ধি ও লেখা নিষ্কাশন বিষয় একটি নম্বর সমাধান করা হয়েছে.


                      • আবশ্যক :

অনুরূপ সফ্টওয়্যার

Bean
Bean

12 May 15

Unirest (PHP)
Unirest (PHP)

6 Jun 15

PersistJS
PersistJS

6 Jun 15

Session.js
Session.js

21 Jul 15

বিকাশকারী অন্যান্য সফ্টওয়্যার Apache Software Foundation

Apache POI
Apache POI

6 Mar 16

Apache Cayenne
Apache Cayenne

13 Apr 15

Apache Wookie
Apache Wookie

13 Apr 15

Apache Etch
Apache Etch

13 Apr 15

মন্তব্য Apache Tika

পাওয়া মন্তব্যসমূহ না
মন্তব্য যোগ করুন
ছবি চালু!
বিভাগ দ্বারা অনুসন্ধান