Contenidos
Imprimir pagina web protegida
Estoy buscando una manera de convertir una página web a PDF, pero conservando el aspecto de la página web. También conservando el texto de la página web (que se puede seleccionar) y que se puede buscar [si se genera una imagen de pantalla para la página web, el texto no se puede seleccionar ni buscar].
No es necesario leer nada de lo que sigue (la pregunta es sólo la sección anterior) para entender mi pregunta. La siguiente sección es sólo una lista de lo que he conseguido a través de la investigación o las respuestas de otros de una manera anidada con el fin de llegar a una respuesta para la pregunta.
Todos los plugins de captura de imágenes de páginas web (por ejemplo, Abduction, Awesome Screenshot, Fireshot, Firefox Screenshot Developer Tool, Full Page Screen Capture, Page2Images, web-capture, …) no responden a mi pregunta, porque no conservan el texto y los enlaces.
Disfrutamos bastante de las capacidades de esta herramienta en la línea de comandos. También la llamamos usando código python para renderizar el estado actual de las páginas web. Tiene la opción de entregar la página web como pdf, por lo general no es perfecto para preservar la vista del sitio web debido al formato de la página (A4 por ejemplo), o como png (conserva la vista de la página, pero no los enlaces)
Cómo guardar una página web protegida como pdf
Copie el contenido de una página inhabilitada para la impresión pulsando las teclas “Ctrl + A” a la vez para seleccionar todo el texto y otros elementos de la página. Pulse “Ctrl + C” para copiar el contenido seleccionado en el portapapeles. Abre un procesador de textos como Microsoft Word u OpenOffice.org, crea un nuevo documento y haz clic en cualquier lugar de la página en blanco. Pulsa “Ctrl + V” para pegar el contenido del portapapeles en el nuevo documento. Ahora deberías poder imprimir el documento directamente desde tu programa de procesamiento de textos.
Pulsa la tecla “Imprimir pantalla” si la página web que quieres imprimir cabe en una sola ventana del navegador y no requiere desplazamiento. De este modo, se capturará una imagen de la ventana del navegador y se copiará la imagen en el portapapeles. Pulsa “Ctrl + V” para pegar la captura de pantalla en el procesador de textos o el editor gráfico que prefieras. Imprima una copia impresa de la información directamente desde su procesador de textos o programa gráfico.
Cómo imprimir la página web completa de chrome
Para ser precisos: Espero que el navegador renderice el mismo contenido de la página de la misma manera, excepto en un lienzo con altura infinita, y luego decida de manera específica para la impresión cómo distribuir los resultados a través de las páginas físicas de papel.
Ahora, cuando imprimas, la impresión será exactamente lo que veas. Asegúrate de mantener las herramientas de revelado abiertas hasta que imprimas. Una vez que cierre las herramientas de desarrollo, la configuración de renderizado volverá a ser normal.
Estoy usando la extensión de Chrome: Captura de pantalla de la página web. Con dos clics la página web completa se convierte en jpg o pdf. Ya no es necesario pegar las capturas de pantalla uno mismo. Esta página se ve así:
Aquí hay otro llamado OpenScreenShoot. Me encanta porque es de código abierto, disponible en GitHub, y me funcionó para una página web muy larga en la que, otras alternativas como WebpageScreenShot fallaron.
Imprimir todos los marcos de la página web
Son varias páginas, pero cuando las imprimo en Firefox y Chrome, sólo imprimen la primera página. La única forma que he encontrado para imprimir la página es imprimirla en IE en formato XPS Document Writer.
Para imprimir un solo cuadro (más largo), hay que decirle al navegador que lo imprima sin los demás. Puede hacerlo haciendo clic con el botón derecho del ratón en el marco que desea imprimir y elegir “Marco actual” -> “Imprimir marco” (el texto puede variar para otros navegadores distintos de Firefox)
Existe un plugin muy útil para Firefox llamado Print Edit, que permite previsualizar las páginas y luego modificar la salida para adaptarla a tus necesidades. Puedes encontrarlo aquí: https://addons.mozilla.org/en-US/firefox/addon/print-edit/
También puedes hacer clic con el botón derecho del ratón en el marco que quieres imprimir y seleccionar imprimir (si el clic derecho no está desactivado). Al menos eso solía funcionar en las versiones antiguas de IE, no estoy seguro de si sigue siendo así ahora con otros navegadores.
Buena solución para imprimir páginas web usando la captura de pantalla en Firefox. La página se imprimirá como una imagen. No será posible agarrar ningún texto, pero es posible hacer copias pdf bastante precisas de páginas web enteras.