Apache Tika

সফটওয়্যার স্ক্রিনশট:
Apache Tika
সফটওয়্যার বিবরণ:
সংস্করণ: 1.9 আপডেট
তারিখ আপলোড: 20 Jul 15
ডেভেলপার: Apache Software Foundation
লাইসেন্স: বিনামূল্যে
জনপ্রিয়তা: 320

Rating: 4.0/5 (Total Votes: 2)

এ এ্যাপাচি Tika অন্যান্য ফাইল ভিতরে কন্টেন্ট অনুসন্ধানের জন্য একটি নিম্ন স্তরের টুলকিট হিসাবে উন্নত ছিল.
টিকা নিজস্ব একটি সহজ লাইব্রেরি হচ্ছে বেশি কিছু না, কিন্তু এটি একটি সম্পূর্ণ ক্রিয়ামূলক ইন ফাইল সার্চ সিস্টেম প্রদান সার্চ ইঞ্জিন, ডিজিটাল অ্যাসেট ম্যানেজমেন্ট সিস্টেম বা সিএমএস মত আরো শক্তিশালী সরঞ্জাম একত্রিত করা যেতে পারে.
গ্রন্থাগারের দ্রুত সামগ্রিক ফাইলের তথ্যের জন্য শুধু ফাইল এর হেডার অ্যাক্সেস করতে পারেন, অথবা এটি সত্যিই গভীর যান এবং টেক্সট বা বাইনারি বিন্যাসে, তথ্য বিভিন্ন ধরনের ফাইল শরীরে এমনকি অনুসন্ধান করতে পারেন.
ফাইল ধরনের একটি বিস্তৃত সমর্থিত এবং Tika এছাড়াও তৃতীয় পক্ষের বাইন্ডিং এবং চাদরে সিরিজের অন্যান্য প্রোগ্রামিং ভাষা ধন্যবাদ সাথে ব্যবহার করা যেতে পারে.

এই রিলিজে নতুন কি

  • এই রিলিজে বাগ সংশোধন করা হয়েছে এবং একটি নতুন টেসেরাক্ত OCR পার্সার সহ নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


  • আপনি কি সংস্করণ 1.8 এ নতুন:

    • এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


    • আপনি কি সংস্করণ 1.7 এ নতুন:

      • এই রিলিজে একটি নতুন টেসেরাক্ত সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে OCR পার্সার; একটি নতুন GDAL পার্সার; আরো Tika স্থিতিশীলতার মধ্যে বিন্যাস, এবং সামগ্রিক উন্নতি সমর্থিত.


      • আপনি কি সংস্করণ 1.6 এ নতুন:

        • এই রিলিজে একটি নতুন অনুবাদ সহ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে এপিআই, আরো সমর্থিত বিন্যাসের, এবং Tika স্থিতিশীলতার মধ্যে সার্বিক উন্নতি.


        • আপনি কি সংস্করণ 1.5 এ নতুন:.

          • প্রতিটি PDF ফাইলের শেষে এমবেড ফাইল প্রক্রিয়াকরণের হ্যান্ডলিং মধ্যে স্থায়ী বাগ

          • <লি> যোগ SourceCodeParser জাভা সমর্থন, খাঁজকাটা, সি ++ ফাইল.


            <লি> Tika সার্ভার একাধিক / ফরম-তথ্য প্লেলোডগুলির সমর্থন আপডেট করা হয়েছে.


            CXF 2.7.8 করতে <লি> আপডেট Tika সার্ভার.


            <লি> আপডেট Tika সার্ভার ওয়াইল্ডকার্ড অ্যাড্রেস ধরে অনুরোধ গ্রহণ করতে.


            <লি> বিকল্প NonSequentialPDFParser ব্যবহার করার অপশন যোগ করা হয়েছে.


            <লি> পিডিএফ AcroForms থেকে কনটেন্ট এখন আহরণ করা হয়.


            <লি> পিপিটি মাস্টার স্লাইড থেকে স্থায়ী অবৈধ আস্টেরিক্স.


            <লি> যোগ পরীক্ষার ক্ষেত্রে PPT এবং pptx মধ্যে অটো-তারিখ সামলাচ্ছে জ্ঞাপন করুন.


            সংস্করণ 1.4 নতুন আপনি কি:

            • একটি দুর্বল নির্বাচিত জিপিএল টেক্সট সঙ্গে একটি পরীক্ষা এইচটিএমএল ফাইলে অপসারিত এটা.


              Tika-সার্ভারে <লি> উন্নতি এটি টেক্সট / এইচটিএমএল ও টেক্সট / XML বিষয়বস্তু তৈরী করার অনুমতি দেয়.


              <লি> উন্নতি সত্যতে সেট decompressConcatenated বিকল্প প্রয়োজন যে g'zipped ফাইল হ্যান্ডেল কম্প্রেসার parser থেকে তৈরি করা হয়েছে.


              <লি> বাঙালীরা ফাইল সনাক্তকরণ থেকে প্রতিরোধ ছিল একটি মুদ্রণ ত্রুটি ঠিকানাসংবলিত.


            • সংস্করণ 1.2 নতুন আপনি কি:

              • এ্যাপাচি Tika 1.2 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.


              • সংস্করণ 1.0 নতুন আপনি কি:

                • এ্যাপাচি Tika 1.0 উন্নতি ও বাগ সংশোধন করা হয়েছে একটি সংখ্যা উপস্থিত রয়েছে.


                • আপনি কি সংস্করণ 0.9 এ নতুন:.

                  • এই রিলিজে বেশ কিছু গুরুত্বপূর্ণ বাগ সংশোধন করা হয়েছে এবং নতুন বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে

                  • আপনি কি সংস্করণ 0.8 এ নতুন:

                    • ভাষা সনাক্তকারী এখন একটি কনফিগ ফাইল মাধ্যমে পরিবর্তনশীল, কনফিগার পরিচালিত হয় ক্লাসপাথ থেকে লোড.


                      <লি> Tika এখন পার্সিং অন্তর্নিহিত রোম লাইব্রেরি মোড়কে ফীড সমর্থন করে.


                      <লি> Tika পার্সিং জন্য একটি দ্রুত শুরু গাইড অবদান ছিল.


                      <লি> এক্সএইচটিএমএল বৈশিষ্ট্যাবলী মাধ্যমে নদীর জন্য একটি পন্থা যোগ করা হয়েছিল.


                      একটি প্রদত্ত ইনপুট ডকুমেন্ট জন্য শ্রেষ্ঠ পার্সার নির্বাচনের সময় <লি> মিডিয়া টাইপ অনুক্রমের তথ্য এখন বিবেচনায় নেয়া হয়.


                      <লি> netCDF এবং HDF4 / 5 যোগ করা হয়েছিল সহ সাধারণ বৈজ্ঞানিক তথ্য ফরম্যাটের পার্সিং জন্য সমর্থন.


                      উইন্ডোজের জন্য <লি> ইউনিট পরীক্ষা TestParsers সম্পন্ন করতে সক্ষম হবেন, সংশোধন করা হয়েছে.


                    • আপনি কি সংস্করণ 0.7 এ নতুন:

                      • MP3 ফাইল পার্সিং চ্যানেল ও স্যাম্পলরেট নিষ্কাশন সহ উন্নত করা হয় এবং ID3v2 সমর্থন. উপরন্তু, অডিও পার্সিং MIME সনাক্তকরণ এখন MIDI বিন্যাস জন্য উন্নত ছিল.


                        <লি> Tika আর তার RTF পরস্পরের পার্সিং কার্যকারিতার জন্য X11 উপর নির্ভর করে.


                        <লি> AutoDetectParser একটি থ্রেড-নিরাপদ বাগ আবিষ্কার করেন এবং বক্তৃতা করেন.


                        <লি> PDFBox 1.0.0 আপগ্রেড করুন. নতুন PDFBox সংস্করণ পিডিএফ পার্সিং কর্মক্ষমতা বৃদ্ধি ও লেখা নিষ্কাশন বিষয় একটি নম্বর সমাধান করা হয়েছে.


                      • আবশ্যক :

অনুরূপ সফ্টওয়্যার

jQuip
jQuip

12 May 15

EnhanceJS
EnhanceJS

12 May 15

Inject
Inject

1 Oct 15

বিকাশকারী অন্যান্য সফ্টওয়্যার Apache Software Foundation

Apache FtpServer
Apache FtpServer

5 Jun 15

Apache Kafka
Apache Kafka

10 Dec 15

মন্তব্য Apache Tika

পাওয়া মন্তব্যসমূহ না
মন্তব্য যোগ করুন
ছবি চালু!
বিভাগ দ্বারা অনুসন্ধান