12
ArchiveBox
arch بایگانی وب خود میزبان منبع آزاد.تاریخچه / بوک مارک ها / جیب / Pinboard / موارد دیگر را مرور می کند ، HTML ، JS ، PDF ها ، رسانه ها و موارد دیگر را ذخیره می کند.
- نرم افزار رایگان
از آنجا که وب سایت های مدرن پیچیده هستند و اغلب به محتوای پویا متکی هستند ، بایگانی بایگانی سایت ها را در قالب های مختلف فراتر از آنچه خدمات بایگانی عمومی مانند Archive.org و Archive.is قادر به ذخیره هستند ، بایگانی می کنند.ArchiveBox لیستی از URL ها را از stdin ، url از راه دور یا پرونده وارد می کند ، سپس با استفاده از wget صفحات را به یک پوشه بایگانی محلی اضافه می کند تا یک کلون html قابل مشاهده ، youtube-dl برای استخراج رسانه و نمونه کامل Chrome بدون سرور برای PDF ،اسکرین شات ، Dump DOM و موارد دیگر ... با استفاده از چندین روش و مرورگر حاکم بر بازار برای اجرای JS اطمینان می دهیم که می توانیم حتی در چند قالب داده بلندمدت و باکیفیت حتی پیچیده ترین وب سایت ها را ذخیره کنیم.### می توانید پیوندها را از طریق: - جیب ، Pinboard ، Instapaper - RSS ، XML ، JSON یا لیست متن ساده وارد کنید - تاریخچه مرورگر یا نشانک ها (Chrome ، Firefox ، Safari ، IE ، Opera و موارد دیگر) - Shaarli، Delicious، Redditپست های ذخیره شده ، Wallabag ، Unmark.it و هر متن دیگری با پیوندهای موجود در آن!### می توانید این موارد را برای هر سایت ذخیره کنید: - `favicon.ico` favicon سایت -` مثال.com / page-name.html` کلون wget سایت ، با .html در صورت عدم وجود ضمیمه می شود.pdf` چاپ شده PDF از سایت با استفاده از کروم بدون سر - - screenshot.png` تصویر صفحه 1440x900 با استفاده از کروم بدون سر - - output.html` DOM دامپک HTML را پس از ارائه با استفاده از کروم بدون سر - - archive.org.txt` پیوندی بهسایت ذخیره شده در archive.org - `warc /` برای فایل warc html + gzipped.gz - `media /` هر mp4 ، mp3 ، زیرنویس و ابرداده با استفاده از یوتیوب-dl - `git /` کلون از هر مخزن برای لینک های github ، bitbucket یا gitlab یافت می شود - `index.html` &` index.json`پرونده های شاخص HTML و JSON که شامل ابرداده و جزئیات هستند بایگانی افزودنی است ، بنابراین می توانید برنامه ". / بایگانی" را برای اجرای منظم و پیوندهای جدید به فهرست برنامه ریزی کنید.کلیه محتوای ذخیره شده استاتیک بوده و با پرونده های JSON فهرست بندی می شود ، بنابراین برای همیشه زنده می ماند و به راحتی قابل تجزیه است ، نیازی به پس زمینه همیشه در حال اجرا ندارد.
archivebox
دسته بندی ها
گزینه های ArchiveBox برای Mac با مجوز تجاری
19
17
SiteSucker
برنامه macOS که به صورت خودکار وب سایت ها را از اینترنت بارگیری می کند.این کار را با کپی کردن همزمان از صفحه های وب سایت ، تصاویر ، PDF ها ، شیوه نامه ها و سایر فایلها در هارد دیسک محلی شما انجام می دهد و ساختار فهرست آن سایت را کپی می کند.
3
1
Web Dumper
کل وب سایت ها را از اینترنت بارگیری کنید و آنها را در هارد دیسک خود ذخیره کنید ...