বড় তথ্য একটি বিপণন শব্দ যা অনুসন্ধান ইঞ্জিন, পয়েন্টার কার্ডগুলি দ্বারা ট্র্যাক করা মুদি দোকানের জিনিসপত্র ইত্যাদি সূত্র থেকে ডেটা খনি এর সম্পূর্ণ ধারণাকে অন্তর্ভুক্ত করে। আধুনিক পৃথিবীতে, ইন্টারনেটে অনেক আছে তথ্য উত্স, যে প্রক্রিয়াকরণ এবং প্রক্রিয়াকরণের ছাড়া স্কেল আরো প্রায়ই তুলনায় এটি উপভোগ করে তোলে কোন এক সার্ভার অবিশ্বাস্য পরিমাণে নিতে হবে এপাচি হডোওপ লিখুন
ডেটা প্রক্রিয়াকরণের জন্য কম সময়Hoodop আর্কিটেকচারকে একটি নেটওয়ার্কে একাধিক মেশিনের প্রসেসিং কাজ বিতরণ করার দ্বারা , প্রক্রিয়াকরণের সময়গুলি জ্যোতির্বিজ্ঞান হ্রাস করা হয় এবং উত্তর সঠিক পরিমাণে নির্ধারণ করা যেতে পারে। আপাচি হডোপ দুটি ভিন্ন অংশে বিভক্ত: একটি স্টোরেজ উপাদান এবং একটি প্রক্রিয়াকরণ উপাদান। সহজ শর্তে হ্যাপুড একাধিক দৈহিক যন্ত্রের এক ভার্চুয়াল সার্ভার করে তোলে। বাস্তবিকই, হডোপ একাধিক মেশিনের মধ্যে যোগাযোগ পরিচালনা করে যেমন তারা একসঙ্গে কাজ করে যাতে মনে হয় যে কম্পিউটেশনে কাজ করা একমাত্র মেশিন রয়েছে। ডাটা একাধিক মেশিনের মধ্যে বিতরণ করা হয় সংরক্ষণ করা এবং প্রক্রিয়াকরণ কর্মগুলি হডোপ আর্কিটেকচার দ্বারা বরাদ্দকৃত এবং সমন্বিত হয়
যে। বিগ ডেটা ইনপুট স্কেলে স্কেল তথ্য কমাতে দরকারী তথ্যের মধ্যে এই ধরনের সিস্টেমের প্রয়োজন। অনুসন্ধান অনুরোধগুলি প্রবেশকারী ব্যবহারকারীদের থেকে প্রতি সেকেন্ডে Google দ্বারা প্রাপ্ত ডেটার পরিমাণ বিবেচনা করুন মোট ডাটা ডাম্পিংয়ের মতো, আপনি কখন শুরু করবেন তা জানতে পারবেন না, কিন্তু হডুপ স্বয়ংক্রিয়ভাবে ডেটা সেটিকে ছোট, সংগঠিত উপসেটে নির্দিষ্ট করে দেবে এবং নির্দিষ্ট সংস্থানগুলিতে এই পরিচালনাযোগ্য উপসেটগুলিকে বরাদ্দ করবে। তারপর সব ফলাফল ফিরে রিপোর্ট এবং ব্যবহারযোগ্য তথ্য একত্রিত ।
একটি সার্ভার সেট করা সহজ
যদিও সিস্টেমটি জটিল বলে মনে হয়, বেশিরভাগ চলন্ত অংশগুলি বিমূর্ততার পিছনে লুকানো আছে। Hadoop সার্ভারটি সেট করা মোটামুটি সহজ। , শুধুমাত্র সিস্টেমের প্রয়োজনীয়তার সাথে মিলিত হার্ডওয়্যারগুলির সার্ভার উপাদানগুলি ইনস্টল করুন। কঠিন অংশটি কম্পিউটারের নেটওয়ার্কের বাইরে পরিকল্পনা করছে Hadoop সার্ভার স্টোরেজ এবং প্রক্রিয়াকরণ ভূমিকা বিতরণ করার জন্য ব্যবহার করা হবে। এটি একটি স্থানীয় এলাকা নেটওয়ার্ক স্থাপন বা ইন্টারনেট জুড়ে একাধিক নেটওয়ার্কের সংযোগ স্থাপন করতে পারে । আপনি বিদ্যমান ক্লাউড পরিষেবাগুলি ব্যবহার করতে পারেন এবং জনপ্রিয় মেঘ প্লাটফর্ম যেমন মাইক্রোসফট Azure এবং Amazon EC2 এ Hadoop ক্লাস্টারের জন্য অর্থ প্রদান করতে পারেন। এইগুলি আরো সহজ করার জন্য কনফিগার করা যেমনটি আপনি তাদের অ্যাড-হককে স্পিন করতে পারেন এবং এরপর ক্লাস্টারগুলিকে অদল করে দিতে পারেন যখন আপনার তাদের আর প্রয়োজন নেই। এই ধরনের ক্লাস্টার পরীক্ষার জন্য আদর্শ হিসাবে আপনি শুধুমাত্র Hadoop ক্লাস্টার সক্রিয় সময় জন্য প্রদান।
আপনার প্রয়োজনীয় তথ্য পেতে আপনার ডেটাতে প্রক্রিয়া করুন
বড় ডেটা একটি অত্যন্ত শক্তিশালী সম্পদ, কিন্তু তথ্যটি বেহিসেবে না থাকলে এটি সঠিকভাবে শ্রেণীভুক্ত করা এবং তথ্য রূপান্তরিত হতে পারে। বর্তমান সময়ে, তথ্যের মধ্যে এই সংগ্রহগুলি প্রক্রিয়া করার জন্য Hadoop ক্লাস্টারগুলি অত্যন্ত ব্যয়বহুল পদ্ধতির প্রস্তাব দেয় ।
পাওয়া মন্তব্যসমূহ না