12
ArchiveBox
arch بایگانی وب خود میزبان منبع آزاد.تاریخچه / بوک مارک ها / جیب / Pinboard / موارد دیگر را مرور می کند ، HTML ، JS ، PDF ها ، رسانه ها و موارد دیگر را ذخیره می کند.
- نرم افزار رایگان
از آنجا که وب سایت های مدرن پیچیده هستند و اغلب به محتوای پویا متکی هستند ، بایگانی بایگانی سایت ها را در قالب های مختلف فراتر از آنچه خدمات بایگانی عمومی مانند Archive.org و Archive.is قادر به ذخیره هستند ، بایگانی می کنند.ArchiveBox لیستی از URL ها را از stdin ، url از راه دور یا پرونده وارد می کند ، سپس با استفاده از wget صفحات را به یک پوشه بایگانی محلی اضافه می کند تا یک کلون html قابل مشاهده ، youtube-dl برای استخراج رسانه و نمونه کامل Chrome بدون سرور برای PDF ،اسکرین شات ، Dump DOM و موارد دیگر ... با استفاده از چندین روش و مرورگر حاکم بر بازار برای اجرای JS اطمینان می دهیم که می توانیم حتی در چند قالب داده بلندمدت و باکیفیت حتی پیچیده ترین وب سایت ها را ذخیره کنیم.### می توانید پیوندها را از طریق: - جیب ، Pinboard ، Instapaper - RSS ، XML ، JSON یا لیست متن ساده وارد کنید - تاریخچه مرورگر یا نشانک ها (Chrome ، Firefox ، Safari ، IE ، Opera و موارد دیگر) - Shaarli، Delicious، Redditپست های ذخیره شده ، Wallabag ، Unmark.it و هر متن دیگری با پیوندهای موجود در آن!### می توانید این موارد را برای هر سایت ذخیره کنید: - `favicon.ico` favicon سایت -` مثال.com / page-name.html` کلون wget سایت ، با .html در صورت عدم وجود ضمیمه می شود.pdf` چاپ شده PDF از سایت با استفاده از کروم بدون سر - - screenshot.png` تصویر صفحه 1440x900 با استفاده از کروم بدون سر - - output.html` DOM دامپک HTML را پس از ارائه با استفاده از کروم بدون سر - - archive.org.txt` پیوندی بهسایت ذخیره شده در archive.org - `warc /` برای فایل warc html + gzipped.gz - `media /` هر mp4 ، mp3 ، زیرنویس و ابرداده با استفاده از یوتیوب-dl - `git /` کلون از هر مخزن برای لینک های github ، bitbucket یا gitlab یافت می شود - `index.html` &` index.json`پرونده های شاخص HTML و JSON که شامل ابرداده و جزئیات هستند بایگانی افزودنی است ، بنابراین می توانید برنامه ". / بایگانی" را برای اجرای منظم و پیوندهای جدید به فهرست برنامه ریزی کنید.کلیه محتوای ذخیره شده استاتیک بوده و با پرونده های JSON فهرست بندی می شود ، بنابراین برای همیشه زنده می ماند و به راحتی قابل تجزیه است ، نیازی به پس زمینه همیشه در حال اجرا ندارد.
archivebox
دسته بندی ها
گزینه های ArchiveBox برای همه سیستم عامل های دارای مجوز
2
WebArchives
یک مشاهده گر بایگانی وب که توانایی مرور میلیون ها مقاله آفلاین از پروژه های بزرگ جامعه مانند ویکی پدیا یا ویکی منبع را دارد. ویژگی ها:
1
Web Dumper
کل وب سایت ها را از اینترنت بارگیری کنید و آنها را در هارد دیسک خود ذخیره کنید ...