No deixeu que els fluxos de treball de la prepressió us alentin! El nostre jo - eines desenvolupades augmenten l'eficiència en gairebé 10 vegades
Antecedents de desenvolupament: provinents de les necessitats de producció reals
El processament de documents pre -premsa per a la impressió digital requereix massa temps. Després de comunicar -se amb els operadors de primera línia, s’han identificat i confirmat tres requisits bàsics.
(1) Números de pàgina de document de comprovació per lots: a la impressió i a la tipografia, sovint és necessari assegurar -se que els números de la pàgina del document siguin parells, en cas contrari, pot provocar residus de materials o errors d’enllaç.
(2) Processeu automàticament documents de pàgina ODD: Per a documents amb pàgines estranyes, s'hauria d'afegir una pàgina en blanc uniformement al final, mentre que els documents amb pàgines uniformes haurien de romandre inalterades.
(3) Comprovació per lots per a la inflexió de text: per evitar els errors d'impressió causats pels tipus de lletra que falten, cal confirmar si el text del document s'ha convertit en corbes (és a dir, "inflexió").
Mitjançant la investigació sobre Adobe Acrobat i diversos plugins de processament PDF al mercat, es va trobar que les eines existents tenen funcions redundants i complexes, o bé no coincideixen amb el procés de producció real de la companyia, especialment en termes de riscos de seguretat en la conversió de fitxers. Més important encara, les eines similars produïdes domèsticament sovint requereixen el pagament, donant lloc a costos d’ús del termini llargs llargs -. A partir dels problemes pràctics esmentats, la companyia ha decidit desenvolupar una eina especialitzada lleugera, precisa i compatible internament.
Eina de verificació i processament de pàgines PDF
01
Funcions bàsiques i lògica de judici
L’objectiu principal d’aquesta eina és assegurar que totes les pàgines del document que s’imprimeixin siguin uniformes, i el seu enfocament de judici i execució és el següent.
(1) Mecanisme de detecció de pàgines: llegiu els metadades dels documents PDF a través de la biblioteca PyMUPDF per obtenir directament la informació total de la pàgina.
(2) Lògica de judici de paritat: utilitzeu el funcionament del mòdul (número de pàgina% 2) per determinar la paritat. Si el resultat és 1, es jutja com una pàgina estranya i si el resultat és 0, es jutja com a pàgina uniforme.
(3) Estratègia de processament de diferenciació: si es tracta d’un document numerat estrany, afegiu automàticament una pàgina en blanc de la mateixa mida que el document original al final del document; Si es tracta d’un document de pàgina uniforme, mantingueu el contingut sense canvis i copieu -lo directament al directori de sortida.
(4) Principi de processament de seguretat: Tots els documents processats es guarden al directori "fitxers processats" designat i els fitxers originals es mantenen sense canvis per evitar danys del fitxer causats per la mala operació, tal com es mostra a la figura 1.
Figura 1 Interfície de l'eina de verificació i processament de la pàgina PDF
02
Punts clau de la implementació tècnica
L’eina utilitza TKinter per crear una interfície gràfica, que inclou principalment tres mòduls funcionals.
(1) Mòdul de selecció del directori: admet la selecció visual dels directoris de fitxers d'origen i els directoris de sortida, sent el directori de sortida predeterminat un subcarpeta sota el directori d'origen.
(2) Mòdul de processament per lots: utilitzant la tecnologia roscada multi - per implementar el processament de backend, evitar el retard de la interfície i mostrar el progrés de processament en el temps real - a través d'una barra de progrés.
(3) Mòdul de visualització de resultats: Presenteu els resultats de processament de cada fitxer en un format de taula, inclòs el número de pàgina original, les accions de processament i la informació d'estat i distingeixen els estats amb èxit i fallit per color.
Eina de revisió de conversió PDF
01
Funcions bàsiques i lògica de judici
L’eina de verificació de la corba se centra en determinar si el text del document s’ha convertit en una corba i la seva lògica de judici bàsic es basa en l’anàlisi de la informació de tipus de lletra en documents PDF.
(1) Detecció de presència de text: mitjançant la funció d'extracció de text de la pàgina, determineu si el document conté text editable.
(2) Anàlisi de la informació de tipus de lletra: analitzeu la llista de tipus de lletra incrustats al document. Si hi ha informació de tipus de lletra, indica que el text no s'ha convertit.
(3) Regla de judici integral: si hi ha contingut de text, però no hi ha informació de tipus de lletra, indica que la cançó s'ha convertit (marcada en verd); No hi ha contingut de text, que indiqui que no cal canviar les pistes (etiqueta verda); Si hi ha contingut de text i informació de tipus de lletra, indica que la cançó no s'ha convertit (marcada en vermell), com es mostra a la figura 2.
L’eina està especialment dissenyada per al mode “només comproveu sense conversió”, principalment perquè segons els comentaris dels operadors, quan realitzeu l’operació de conversió en fitxers que contenen segells oficials, és fàcil provocar la pèrdua de segells oficials i altres patrons. Per tant, només es conserva la funció de comprovació.
Figura 2 Eina de revisió de conversió PDF
02
Punts clau de la implementació tècnica
Aquesta eina també utilitza TKinter per crear la interfície i els punts tècnics clau inclouen els tres punts següents.
(1) Extracció d'informació de tipus de lletra: utilitzant la funció d'anàlisi del bloc de text de PyMUPDF, obteniu els noms i les ocurrències de tots els tipus de lletra utilitzats al document.
(2) Visualització de resultats: utilitzeu una vista d’arbre per mostrar els resultats d’inspecció i distingiu visualment diferents estats a través de colors i icones.
(3) Funció d'estadístiques d'estat: Calculeu automàticament el nombre de fitxers que compleixen els requisits, ajudant els operadors a comprendre ràpidament la situació global d'inspecció.
Dificultats i solucions en el procés de desenvolupament
Com a desenvolupador no professional, he trobat molts reptes tècnics durant el procés de desenvolupament d’eines. Els problemes i solucions específiques són els següents.
(1) Problema de profunditat de l'anàlisi de PDF: La biblioteca PDF inicial utilitzada no va poder extreure amb precisió la informació de tipus de lletra. Després de la recomanació de l'AI, es va resoldre substituint -la per la biblioteca PyMUPDF.
(2) Problema de retard de la interfície: Quan es processen un gran nombre de fitxers a granel, la interfície és propensa a estats sense resposta. Amb l’orientació de l’IA, s’ha implementat una solució de processament roscada multi - per resoldre eficaçment aquest problema.
(3) Personatges xinesos de pantalla xinesa: configurant els paràmetres de tipus de lletra i la configuració de codificació, s'ha resolt el problema dels caràcters de la visualització xinesa a la interfície i els fitxers exportats.
(4) Mecanisme de manipulació d'excepcions: en resposta al problema dels accidents del programa causats per fitxers PDF danyats, s'ha millorat un mecanisme de captura d'excepcions per garantir que la fallada del processament de fitxers individual no afecta el procés global.
Al llarg del procés de desenvolupament, les eines d’AI van tenir un paper important com a consultors tècnics, proporcionant no només exemples de codi clau, sinó que també expliquen els principis de l’analització del format de fitxer PDF, ajudant els desenvolupadors a comprendre ràpidament el coneixement de domini professional.
El valor i la perspectiva de l’aplicació d’eines
L’aplicació d’aquestes dues eines ha aportat millores d’eficiència importants als treballs de producció, que es reflecteixen en els dos aspectes següents.
(1) Estalvi de costos de temps: els treballs d’inspecció manual que originalment requereixen 1 hora es poden completar en 5 minuts, augmentant l’eficiència gairebé 10 vegades.
(2) Estabilitat de qualitat millorada: evitar eficaçment les omissions d’inspecció manual i assegurar la qualitat d’impressió estable.
El registre del procés de desenvolupament d’aquestes dues petites eines té com a objectiu transmetre la filosofia de treball de la “exploració i la innovació”, centrar -se en la resolució de problemes específics en la producció real, optimitzar els fluxos de treball tradicionals a través dels mitjans tecnològics i, finalment, aconseguir l’objectiu de la reducció de costos i la millora de l’eficiència.

