lxml

সফটওয়্যার স্ক্রিনশট:
lxml
সফটওয়্যার বিবরণ:
সংস্করণ: 3.4.1
তারিখ আপলোড: 17 Feb 15
ডেভেলপার: Martijn Faassen
লাইসেন্স: বিনামূল্যে
জনপ্রিয়তা: 12

Rating: nan/5 (Total Votes: 0)

lxml পাইথন ডেভেলপার তাদের পাইথন code.An এক্সএমএল প্রক্রিয়াকরণ librarylxml (এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ একটি XML উভয় XML এবং HTML ফাইল ভেতরের সঙ্গে কাজ করতে সক্ষম হবেন, libxml2 এবং libxslt লাইব্রেরি binds যে একটি অত্যাধুনিক, শক্তিশালী, বিনামূল্যে এবং অনন্য পাইথন মডিউল পাইথন প্রোগ্রামিং ভাষায় লেখা) প্রক্রিয়াকরণের লাইব্রেরি, বিশেষভাবে যতটা সম্ভব ElementTree এপিআই স্পেসিফিকেশন অনুসরণ করার জন্য ডিজাইন করা.
এটা যেমন NG (নেক্সট জেনারেশন), xpath, XML স্কিমা, c14n, XSLT এর (এক্সটেনসিবল স্টাইলশিট ল্যাঙ্গুয়েজ) আরাম হিসেবে libxslt এবং libxml2 লাইব্রেরি, নির্দিষ্ট কার্যকারিতা প্রকাশ করার ElementTree এপিআই প্রসারিত করতে পারেন, etc.Use lxml থেকে পাইথন কোড কল XSLT এর stylesheetsDevelopers এক্সটেনশন ফাংশন এর মাধ্যমে XSLT এর স্টাইলশীট এবং XPath এক্সপ্রেশন থেকে পাইথন কোড কল lxml প্রোগ্রাম ব্যবহার করতে সক্ষম হবে. টিউটোরিয়াল বিস্তৃত প্রকল্প & rsquo পাওয়া যায় এর হোমপেজে (নিবন্ধ শেষে লিঙ্কটি দেখুন).
সফ্টওয়্যার নকশা দ্বারা ওপেন সোর্স এবং পাইথন & rsquo সরলতা সঙ্গে উপরোক্ত লাইব্রেরি বৈশিষ্ট্য সম্পূর্ণতার এবং গতি সম্মিলন এর এপিআই (অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস) .Getting lxmlIt দিয়ে শুরু ব্যবহার করে একটি গনুহ / লিনাক্স ডিস্ট্রিবিউশন উপর lxml ইনস্টল করা বেশ সহজ সোর্স আর্কাইভ Softoware এবং প্রকল্প & rsquo বিতরণ এর অফিসিয়াল ওয়েবসাইট. শুধু টার্মিনাল অ্যাপ্লিকেশন খুলুন এবং নিষ্কাশিত আর্কাইভ ফাইলের (যেমন সিডি /home/softoware/lxml-3.4.1) নেভিগেট, এটা আনপ্যাক আপনার হোম ডিরেক্টরি এটি সংরক্ষণ করুন, উৎস প্যাকেজ ডাউনলোড করুন.
ও lsquo চালানো; না & rsquo; একটি আধুনিক কম্পিউটারে প্রায় 1-2 মিনিট সময় নিতে হবে, যা প্রোগ্রাম, কম্পাইল করতে আদেশ. একটি সফল সংকলন করার পর, ও lsquo চালানো; ইনস্টল & rsquo করা; রুট বা কমান্ড ও lsquo; উবুন্টু ইনস্টল & rsquo করা; একটি ছবি তৈরী ব্যবহারকারী হিসাবে কমান্ড গনুহ / লিনাক্স এবং systemsThe সফ্টওয়্যার অপারেটিং মাইক্রোসফট উইন্ডোজ আনুষ্ঠানিকভাবে গনুহ / লিনাক্স এবং উইন্ডোজ অপারেটিং সিস্টেম সমর্থিত হয় lxml সিস্টেম wide.Supports ইনস্টল করতে হবে. এটি সফলভাবে 32 বিট এবং 64 বিট কম্পিউটারে উপর পরীক্ষা করা হয়েছে

এই রিলিজে নতুন কি:.

  • বৈশিষ্ট্য যোগ করেছেন:
  • নতুন htmlfile এইচটিএমএল জেনারেটর ক্রমবর্ধমান xmlfile serialization এপিআই সংসর্গে. Burak আরসালান দ্বারা প্যাচ.
  • বাগ সংশোধন করা হয়েছে:
  • lxml.sax.ElementTreeContentHandler তার সুপারক্লাস সূচনা করা হয়নি.

সংস্করণ 3.3.1 নতুন কি:

  • বাগ সংশোধন করা হয়েছে:
  • এলপি # 1014290: parser.feed সঙ্গে পার্স HTML নথি () ট্যাগ পুনরাবৃত্তির সময় উপাদান খুঁজে পেতে ব্যর্থ হয়েছে
  • .
  • এলপি # 1273709: PyPy বিল্ডিং কারণে * () PyPy এর সি-API 'PyUnicode_Compare () এবং PyByteArray _ জন্য সমর্থন অনুপস্থিত করতে ব্যর্থ হয়েছে
  • .
  • এলপি # 1274413: MSVC মধ্যে সংকলন কারণে অনুপস্থিত & quot ব্যর্থ; stdint.h, & quot; মান হেডার ফাইল.
  • এলপি # 1274118: iterparse () BOM ফাইল অগ্রে যুক্ত বিশ্লেষণ করতে ব্যর্থ হয়েছে
  • .

সংস্করণ 3.0 আলফা 2 নতুন কি:

  • বৈশিষ্ট্য যোগ করা হয়েছে:
  • উপাদানের .iter () মেথড এখন & quot মত ট্যাগ আর্গুমেন্ট গ্রহণ করা; {*} নাম, & quot; কোন নামস্থান একটি প্রদত্ত স্থানীয় নাম উপাদানের জন্য অনুসন্ধান. এই সাথে সাথে, ওয়াইল্ডকার্ড সব সমন্বয় এখন কাজ হিসাবে প্রত্যাশিত: & quot; {NS} নাম & quot ;, & quot; {} নাম & quot ;, & quot; {*} নাম & quot ;, & quot; {NS} * & quot ;, & quot; {} * , & quot; এবং & quot; {*} * & quot ;. যে ও দ্রষ্টব্য quot; নাম, & quot; & quot সমতুল্য হয়; {} নাম & quot ;, কিন্তু, & quot; *, & quot; & quot; {*} * & quot ;. strip_attributes (), strip_elements () এবং strip_tags () ফাংশন; একই পরিবর্তন,) .getiterator (থেকে .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () এবং .itertext () পদ্ধতি প্রয়োগ করা পাশাপাশি iterparse () বর্গ হিসাবে.
  • C14N সমেত উপসর্গ উল্লেখ করতে পারবেন একচেটিয়া serialization সময় উপরের স্তরে উন্নীত করা.
  • বাগ সংশোধন করা হয়েছে:
  • ফিড () পার্সার ইন্টারফেসের মধ্যে দীর্ঘ ইউনিকোড স্ট্রিং পাসিং সম্পূর্ণ পংক্তি পড়তে ব্যর্থ হয়েছে.

সংস্করণ 2.3.5 নতুন কি:

  • ক্র্যাশ element.remove টেক্সট নোড মার্জ যখন ( ).
  • বাদ্যযন্ত্রবিশেষ / লক্ষ্য পার্সার ক্র্যাশ খালি DOCTYPE যখন প্রতিবেদন.

কি সংস্করণ 2.3.4 নতুন:

  • ক্র্যাশ একটি nsmap (এলিমেন্ট সম্পত্তি) সঙ্গে নির্মাণের সময় খালি নামস্থান URIs.
  • কারণে জাতি শর্ত ক্র্যাশ ত্রুটি (অথবা ব্যবহারকারীর বার্তা) থ্রেড XSLT এর প্রক্রিয়াকরণের সময় ঘটতে যখন.
  • সংকলন ত্রুটি উপেক্ষা করতে পারে XSLT এর স্টাইলশীট সংকলন.

সংস্করণ 2.3.2 নতুন কি:

  • বৈশিষ্ট্য যোগ করা হয়েছে:
  • lxml.objectify.deannotate () রুপ নামস্থান ঘোষণা অপসারণ (এবং সাধারণত নামস্থান ঘোষণা পরিষ্কার) টাইপ টীকা মুছে ফেলার পরে একটি নতুন বুলিয়ান বিকল্প cleanup_namespaces আছে.

  • ব্যবহারকারী দিকে lxml.etree একটি অন্যথায় অপ্রয়োজনীয় আমদানি এড়াতে etree.SubElement একটি কপি হিসাবে তার নিজের subelement () ফাংশন অর্জন lxml.objectify
  • .
  • বাগ সংশোধন করা হয়েছে:
  • স্থায়ী, & quot; বংশধর, & quot; cssselect মধ্যে বাগ (lxml 2.3.1 একটি প্রথম ফিক্স পরে) একটি দ্বিতীয় সময়. পূর্ববর্তী পরিবর্তন অনুবাদ প্রকাশের XPath ভিত্তি করে পরীক্ষা নিরীক্ষার জন্য একটি গুরুতর কর্মক্ষমতা রিগ্রেশন ফলে. এই পূর্বে 2.3.1 কাজ যে XSLT এর অবস্থান পাথ হিসাবে উত্পন্ন XPath এক্সপ্রেশন কিছু ব্যবহার ভঙ্গ করে.
  • cssselect কিছু নির্বাচক সংশোধন করা হয়েছে পার্সিং. Combinators, & quot পর হোয়াইটস্পেস; & Gt; & quot ;, & quot; + & quot; এবং & quot; ~, & quot; এখন সঠিকভাবে উপেক্ষা করা হয়. পূর্বে একটি বংশধর Combinator হিসেবে পার্স করা হয় করা হয়. উদাহরণস্বরূপ, & quot; div করুন & gt; .foo, & quot; একই পার্স করা হয়, & quot; div & gt; * .foo, & quot; div & gt; পরিবর্তে, & quot এর .foo. & quot;

সংস্করণ 2.3.1 নতুন কি:

  • বৈশিষ্ট্য যোগ করা হয়েছে:
  • নতুন বিকল্প নির্দিষ্ট ট্যাগ এবং তাদের বিষয়বস্তু (অর্থাৎ তাদের পুরো subtree হয়) মুছে ফেলার জন্য lxml.html.clean মধ্যে kill_tags.

  • প্রসেসিং নির্দেশাবলী টেক্সট কন্টেন্ট থেকে ছদ্ম-বৈশিষ্ট্যাবলী বিশ্লেষণ করতে প্রক্রিয়াকরণ নির্দেশাবলী
  • pi.get () এবং pi.attrib.
  • lxml.get_include () lxml.etree বিরুদ্ধে বহিরাগত সি কোড কম্পাইল করার জন্য ব্যবহার করা যেতে পারে যে পাথ অন্তর্ভুক্ত একটি তালিকা প্রদান করে. কোড নিজেই lxml সঠিক একই হেডার ফাইল সংস্করণ বিরুদ্ধে কম্পাইল করার প্রয়োজন হলে এই বিশেষভাবে স্ট্যাটিক্যালি লিঙ্ক lxml জন্য প্রয়োজন বোধ করা হয় তৈরী করে.
  • Resolver.resolve_file () ফাইল (-মত) বস্তু পড়া বা না পরে বন্ধ হয়ে যাবে যদি কনফিগার করা যে একটি অতিরিক্ত বিকল্প close_file লাগে. ব্যবহারকারী এটি একটি রেফারেন্স রাখা হবে বলে আশা করা না হয় ডিফল্টরূপে, ফাইল, বন্ধ করা হবে.
  • বাগ সংশোধন করা হয়েছে:
  • এইচটিএমএল পরিচ্ছন্নতার 'তথ্য:' অপসারণ করা হয়নি. লিঙ্ক
  • html5lib পার্সার ইন্টিগ্রেশন এখন এটা লাইব্রেরি নতুন রিলিজ সঙ্গে কাজ করে তোলে, যা html5lib নিজেই 'অফিসিয়াল' বাস্তবায়ন, ব্যবহার করে.

  • সংশ্লিষ্ট শুরু ঘটনা ডিফল্ট নামস্থান করা একই প্লেইন ট্যাগ নাম অনুমিত যখন lxml.sax মধ্যে
  • , endElementNS () ভুল একটি প্লেইন ট্যাগ নাম প্রত্যাখ্যান করতে পারে.
  • একটি খোলা ফাইল মত বস্তু পার্স মধ্যে পাস হয় () বা iterparse (), পার্সার করবে আর বন্ধ এটি ব্যবহারের পর. এই সমস্ত ফাইল বন্ধ করা হবে যেখানে lxml 2.3 পরিবর্তন ফেরত্ পাওয়া যাবে. সঠিকভাবে ত্রুটি ক্ষেত্রে এছাড়াও, ফাইল (-মত) বস্তুর বন্ধ করার জন্য ব্যবহারকারীদের দায়িত্ব.
  • lxml.html.cleaner মধ্যে কথন ত্রুটি শীর্ষ স্তরের উপাদান খারিজ করে.

  • Lxml.cssselect মধ্যে
  • , CSS এর জন্য এর পরিবর্তে 'একটি / বংশধর :: বি' এর XPath ('একটি / বংশধর-বা স্ব :: নোড () / বি' এর সংক্ষিপ্ত রূপ) 'একটি // বি' ব্যবহার বংশধর নির্বাচক ('বি'). এই ওয়েবকিট এবং ফায়ারফক্স, এ নির্বাচক আচরণ সঙ্গে সামঞ্জস্যপূর্ণ হতে কয়েক প্রান্ত ক্ষেত্রে তোলে এবং (XSL ব্যবহার করার জন্য: টেমপ্লেট ম্যাচ) আরো CSS এর এক্সপ্রেশন বৈধ অবস্থান পাথ করে তোলে.
  • lxml.html, অ নির্বাচিত ট্যাগ আর সংগৃহীত ফর্ম মান দেখাবে.
  • যোগ করার পদ্ধতি / একাধিক নির্বাচন ফর্ম ক্ষেত্র সঠিকভাবে তাদের নির্বাচন এবং তাদের unselects থেকে / মান সরিয়ে ফেলা হয়.
  • অন্যান্য পরিবর্তন:
  • স্ট্যাটিক --download-ডিরেক্টরি বিকল্প ডাউনলোড ডিরেক্টরি উল্লেখ করতে পারেন তৈরী করে.

সংস্করণ 2.3 নতুন কি:

  • বৈশিষ্ট্য যোগ করা হয়েছে:

  • শিশুদের জন্য যখন খুঁজছেন পিতা বা মাতা নামস্থান উল্টোদিকে
  • , lxml.objectify, একটি খালি নামস্থান অর্থ '{} ট্যাগ' লাগে.
  • বাগ সংশোধন করা হয়েছে:
  • ফাইল মত বস্তু থেকে পড়া শেষ হলে, পার্সার অবিলম্বে তার .close () মেথড কল.

  • পার্সিং কর্ম সমাপ্ত হলে
  • , iterparse () অবিলম্বে ইনপুট ফাইল প্রচেষ্টা.
  • (libxml2 2.7.8 সমাধান করা হয়েছে) একটি severly ভাঙা নথি পার্স পর একটি অ কার্মিক রাষ্ট্র এইচটিএমএল পার্সার চলে যাবে যে libxml2 বাগ জন্য প্রায় কাজ.

  • এইচটিএমএল পরিষ্করণ কোড
  • Marque ট্যাগ সঠিকভাবে নামকরণ করা হয় মার্কি.
  • অন্যান্য পরিবর্তন:
  • Cython স্তরের সি এপিআই কিছু পাবলিক ফাংশন আরো স্পষ্ট ফেরত ধরনের আছে.

সংস্করণে নতুন কি 2.2.8 / 2.3 বেটা 1:

  • নতুন libxml2 সংস্করণ যখন ক্র্যাশ প্রতিস্থাপিত XInclude নোড বৈশিষ্ট্যাবলী ছিল যে নথি মধ্যে উপাদান চলন্ত.
  • XMLID () ফাংশন ঐচ্ছিক পার্সার এবং base_url পরামিতি অনুপস্থিত ছিল.
  • () Py3 ভাঙ্গা ছিল. Iterparse মধ্যে ওয়াইল্ডকার্ড ট্যাগ অনুসন্ধান করুন
  • lxml.html.open_in_browser () কারণে os.tempnam ব্যবহার পাইথন 3 কাজ করে নি. এটি এখন একটি ঐচ্ছিক 'এনকোডিং' প্যারামিটার নেয়.

আবশ্যক

  • পাইথন

অনুরূপ সফ্টওয়্যার

Apache XML-RPC
Apache XML-RPC

14 Apr 15

cssutils
cssutils

14 Apr 15

zbox_wiki
zbox_wiki

20 Feb 15

বিকাশকারী অন্যান্য সফ্টওয়্যার Martijn Faassen

hurry.resource
hurry.resource

11 May 15

z3c.relationfield
z3c.relationfield

14 Apr 15

মন্তব্য lxml

পাওয়া মন্তব্যসমূহ না
মন্তব্য যোগ করুন
ছবি চালু!