Jericho HTML Parser

সফটওয়্যার স্ক্রিনশট:
Jericho HTML Parser
সফটওয়্যার বিবরণ:
সংস্করণ: 3.4
তারিখ আপলোড: 10 Dec 15
ডেভেলপার: Martin Jericho
লাইসেন্স: বিনামূল্যে
জনপ্রিয়তা: 105

Rating: 5.0/5 (Total Votes: 1)

ধারণকৃত কোন অচেনা বা অবৈধ HTML প্রতিলিপি যখন

এটি সার্ভার সাইড ও ক্লায়েন্ট প্রান্তের ট্যাগ সম্পাদনা করতে পারেন.

এটি উচ্চ পর্যায়ের এইচটিএমএল ফর্ম ম্যানিপুলেশন ফাংশন প্রদান করে

বৈশিষ্ট্য :. এর

  • উপস্থিতি বাস্তব বিশ্বের করুন & quot; খারাপভাবে বিন্যস্ত এইচটিএমএল করুন & quot সাথে ব্যবহারের জন্য লাইব্রেরি আদর্শ, যা নথি বাকি, পার্সিং হস্তক্ষেপ না; অন্যান্য পারজার গলগ্রহ হয়ে যায় এমন এইচটিএমএল.


    <লি> এএসপি, JSP, PSP-, পিএইচপি এবং ম্যাসন সার্ভার ট্যাগ স্পষ্টভাবে পার্সার দ্বারা স্বীকৃত হয়. এই স্বাভাবিক এইচটিএমএল এখনও পরিবর্তনশীল উপাদান বৈশিষ্ট্যাবলী যখন সেটিং উদাহরণস্বরূপ সাধারণ, যা তাদের ভিতরে সার্ভার ট্যাগ আছে, এমনকি যদি সঠিকভাবে পার্স করা হয় এর মানে হল যে.


    <লি> একটি ঘটনা ইটারেটরের ব্যবহার বড় ফাইল মেমরি দক্ষ প্রক্রিয়াকরণ পারবেন যা StreamedSource বর্গ, ব্যবহার করে একটি নতুন প্রবাহ ভিত্তিক পার্সিং বিকল্প. এটি মূলত অন্যান্য স্ট্রিমিং পারজার পাওয়া যায় না এইচটিএমএল এবং অ যাচাই এক্সএমএল, সেইসাথে বিভিন্ন অন্যান্য বৈশিষ্ট্য প্রক্রিয়াকরণ ক্ষমতা সঙ্গে একটি আবেদনপত্রের বিকল্প.


    <লি> এটি একটি ইভেন্ট কিংবা বৃক্ষ ভিত্তিক পার্সার, বরং সহজ টেক্সট অনুসন্ধান, দক্ষ ট্যাগ স্বীকৃতি এবং একটি ট্যাগ অবস্থান ক্যাশে সংমিশ্রণ ব্যবহার ত্ত তার স্ট্যান্ডার্ড ফর্ম. পুরো সোর্স ডকুমেন্টের টেক্সট প্রথম মেমরিতে লোড করা হয়, এবং তারপর শুধুমাত্র প্রাসঙ্গিক অংশ প্রতিটি সার্চ অপারেশন প্রাসঙ্গিক অক্ষর অনুসন্ধান.


    নথির শুধুমাত্র ছোট বিভাগে পার্স বা পরিবর্তন করা প্রয়োজন, তাহলে <লি> যেমন ডোম হিসাবে একটি গাছ ভিত্তিক পার্সার সাথে তুলনা করলে, মেমরি এবং সম্পদ প্রয়োজনীয়তা অনেক ভালো হতে পারে. ভুল বা খারাপভাবে বিন্যস্ত এইচটিএমএল সহজেই নিচ থেকে নথিতে প্রতিটি নোডের চিহ্নিত করতে হবে, যা বৃক্ষ নির্ভর পারজার ভিন্ন, উপেক্ষা করা যাবে.


    <লি> যেমন SAX হিসাবে একটি ইভেন্ট ভিত্তিক পার্সার সাথে তুলনা করলে, ইন্টারফেস অনেক উচ্চ স্তরের উপর এবং আরও বেশি ধারণাসম্পন্ন, এবং প্রয়োজনে নথি উপাদান অনুক্রমের একটি বৃক্ষ উপস্থাপনা সহজেই তৈরি করা হয়.


    <লি> শুরু এবং সব পার্স খন্ডের উৎস নথিতে শেষ অবস্থানের একটি গাছ থেকে সম্পূর্ণ নথি পুনর্গঠন করেও ডকুমেন্টের শুধুমাত্র নির্বাচিত খন্ডের পরিবর্তন, যার ফলে প্রবেশযোগ্য.


    <লি> উৎস নথিতে প্রতিটি অবস্থানের সারি এবং কলামের সংখ্যা সহজলভ্য.


    <লি> প্রারম্ভিক মান আহরণ ও জনসংখ্যা সহ এইচটিএমএল ফর্ম নিয়ন্ত্রণ বিশ্লেষণ এবং ম্যানিপুলেশন জন্য একটি সহজ কিন্তু ব্যাপক ইন্টারফেস প্রদান করে, এবং রূপান্তর রিড-ওনলি বা তথ্য প্রদর্শন মোড. এছাড়াও তথ্য ফর্ম থেকে পেয়েছি পারবেন ফর্ম নিয়ন্ত্রণ বিশ্লেষণ সংরক্ষিত যাথাযথভাবে উপস্থাপন করা.


    <লি> অন্তর্নির্মিত কার্যকারিতা যেমন Apache Lucene হিসাবে একটি টেক্সট সার্চ ইঞ্জিন মধ্যে খাওয়ানোর জন্য উপযুক্ত এইচটিএমএল মার্কআপ থেকে সব লেখা, নিষ্কাশন করা.


    <লি> অন্তর্নির্মিত কার্যকারিতা সহজ টেক্সট ফরম্যাটিং সহ HTML মার্কআপ রেন্ডার.


    <লি> অন্তর্নির্মিত কার্যকারিতা নথি উপাদান অনুক্রমের মধ্যে তাদের গভীরতা অনুযায়ী উপাদানের ইন্ডেন্ট যে এইচটিএমএল সোর্স কোড ফরম্যাট করুন. (একটি অনলাইন বিক্ষোভের জন্য এখানে ক্লিক করুন)


    <লি> অন্তর্নির্মিত কম্প্যাক্ট এইচটিএমএল সোর্স কোড কার্যকারিতা সব অপ্রয়োজনীয় সাদা স্থান মুছে ফেলে.


    <লি> কাস্টম ট্যাগ ধরনের সহজেই সংজ্ঞায়িত এবং পার্সার দ্বারা স্বীকৃতি জন্য নিবন্ধিত হতে পারবেন.


  • এই রিলিজে নতুন আপনি কি:.

    • যোগ উত্স (ফাইল) রচয়িতা করুন

    • <লি> যোগ OutputDocument.getSegment () মেথড.


      <লি> যোগ OutputDocument.remove পদ্ধতি (কোন int, কোন int শেষ শুরু).


      <লি> যোগ Renderer.setHRLineLength () মেথড.


      <লি> যোগ RenderToText.jsp WebApp নমুনা.


      <লি> যোগ Segment.getRowColumnVector () মেথড.


      <লি> এনকোডিং সনাক্তকরণ এখন প্রাথমিক এনকোডিং সঙ্গে বেমানান একটি কোড ইউনিট আকার আছে মেটা ট্যাগ উল্লিখিত সাধারণ এনকোডিং উপেক্ষা করে.


      সংস্করণ 3.1 নতুন আপনি কি:

      • বাগ সংশোধন করা হয়েছে:


        <লি> Segment.getAllStartTags অসীম লুপ ()


        <লি> Segment.getAllElements অসীম লুপ ()


        <লি> Segment.getFirst * পদ্ধতি সীমান্ত সেগমেন্ট বাইরে খন্ডের ফিরে.


        <লি> Segment.getAllElements পদ্ধতি কিছু পরিস্থিতিতে সব ঘিরা উপাদান ফিরে না.


        Segment.getAllElements পদ্ধতি
      • স্থায়ী ডকুমেন্টেশন ত্রুটি.


        <লি> যোগ StreamedSource বর্গ.


        বিদ্যমান প্রোগ্রাম আচরণ প্রভাবিত করতে পারে যে <লি> পরিবর্তনসমূহ:


        ক্লাস থেকে ParseText পরিবর্তিত <লি> ইন্টারফেস.


        <লি> Segment.getNodeIterator () এখন পৃথক নোড চরিত্রেও রেফারেন্স ফেরত পাঠায়.


        অ্যাট্রিবিউট মূল্য রেগুলার এক্সপ্রেশন উপর ভিত্তি করে <লি> যোগ ট্যাগ অনুসন্ধান পদ্ধতি.


        এইচটিএমএল বর্গ অ্যাট্রিবিউট উপর ভিত্তি করে <লি> যোগ ট্যাগ অনুসন্ধান পদ্ধতি.


        <লি> যোগ স্ট্যাটিক Source.LegacyNodeIteratorCompatabilityMode সম্পত্তি সাময়িকভাবে পূর্ববর্তী সংস্করণে যে Segment.getNodeIterator () কার্যকারিতা পুনঃস্থাপন.


        ParseText
      • অপসারিত গৃহস্থালি [] ভিত্তিক অনুসন্ধান পদ্ধতি.


        <লি> যোগ CharacterReference.appendCharTo (Appendable) পদ্ধতি.


        <লি> যোগ OutputDocument (অংশ) রচয়িতা.


        <লি> যোগ StreamedSourceCopy নমুনা প্রোগ্রাম.


অনুরূপ সফ্টওয়্যার

eCSStender
eCSStender

21 Jul 15

pynliner
pynliner

13 May 15

Markdown
Markdown

22 Jul 15

বিকাশকারী অন্যান্য সফ্টওয়্যার Martin Jericho

মন্তব্য Jericho HTML Parser

পাওয়া মন্তব্যসমূহ না
মন্তব্য যোগ করুন
ছবি চালু!
বিভাগ দ্বারা অনুসন্ধান