Unstructured তথ্য মোকাবেলা
অনেক অ্যাপ্লিকেশন ফরম্যাট বা চিহ্নিত আপ নথি টেক্সট কন্টেন্ট অ্যাক্সেস প্রয়োজন. নথি সংরক্ষণাগার যে প্রতিষ্ঠান প্রায়ই নথি অনুসন্ধানযোগ্য করা এবং নথি আর্কাইভ বিষয়বস্তু অ্যাগ্রিগেশন, রিপোর্টিং এবং খনির সক্রিয় করতে পাঠগত কন্টেন্ট অ্যাক্সেস প্রয়োজন. অনুসন্ধান এবং আহরণ আবেদন এছাড়াও নিষ্কাশন এবং বিভিন্ন ফাইল ফরম্যাটের থেকে টেক্সট tokenize করতে হবে.
অ্যাক্সেস এবং নথি থেকে টেক্সট নিষ্কাশন এক আদর্শ প্রক্রিয়া মাইক্রোসফট সার্চ ইঞ্জিন ব্যবহার করা IFilter প্লাগ-ইন ইন্টারফেস দ্বারা প্রদান করা হয়. ফাইল ফরম্যাটের বিভিন্ন আবরণ যে মাইক্রোসফট এবং অন্যান্য বিক্রেতাদের দ্বারা বিকশিত একটি কয়েক IFilter বাস্তবায়নের আছে. আদর্শ বা নির্ভরযোগ্যতা এবং টেক্সট নিষ্কাশন মানের একাধিক IFilter ডেভেলপারদের জুড়ে পরিবর্তিত হয়.
Opait টেক্সট ফিল্টার ইতিমধ্যে হোস্ট কম্পিউটার হিসেবে ডিফল্ট IFilter বাস্তবায়নের উপর ফাইল ফরম্যাটের সাথে সরাসরি কাজ এবং উন্নত, যা কয়েক কাস্টম টেক্সট নিষ্কাশন ফিল্টার ইনস্টল করা হয় যে IFilters একটি সহজ ইন্টারফেস সঙ্গে একটি ছোট ইউটিলিটি প্রোগ্রাম.
.
আবশ্যক p>
নেট ফ্রেমওয়ার্ক 4.5
পাওয়া মন্তব্যসমূহ না