0
Newspaper
روزنامه یک استخراج ابرداده از متن ، متن و مقاله است که با پایتون 3 ساخته شده است. ویژگی ها - کار با 10+ زبان (انگلیسی ، چینی ، آلمانی ، عربی ، ...) - چارچوب بارگیری مقالات چند رشته ای - شناسه آدرس اینترنتی اخبار -استخراج متن از html - استخراج تصویر بالا از html - استخراج کلیه تصاویر از HTML - استخراج کلمه کلیدی از متن - استخراج خلاصه از متن - استخراج نویسنده از متن - استخراج اصطلاحات روند Google
سایت اینترنتی:
http://newspaper.readthedocs.io/دسته بندی ها
گزینه های دیگر برای Newspaper برای Self-Hosted
0
artoo.js
artoo.js قطعه ای از کد JavaScript است که قرار است در کنسول مرورگر شما اجرا شود تا برخی از ابزارهای scraping را در اختیار شما قرار دهد.
- نرم افزار رایگان
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted