PDF to Semantic Text

per Ivan Revelli
in Pascal, Programmazione
on Marzo 17, 2008

Piccola implementazione di un parser PDF, l’articolo è una bozza in corso d’opera, comunque l’argomento è relativo al parsng in batch di documenti pdf estraendo tutte le informazioni di rilievo dai documenti , e questo sarebbe semoplicemente un PDF to Text. Mi è balenata in mente l’idea di pesare i contenuti in funzione delle proprietà visive del testo. Cioè riconoscere un titolo in funzione della posizione o della deimensione del carattere e pesare di conseguenza le parole.

A Breve concluderò l’articolo ora son un po di corsa….

byebye

Tags: PDF, Semantic Text

Lascia un commento

Devi essere connesso per inviare un commento.

Categorie

Articoli (553)
- databases (46)
  - Firebird SQL (26)
  - oracle (14)
- Hardware (17)
  - Iot Embedded (4)
- hosting (20)
- Programmazione (169)
  - Android (20)
  - Apple iOS (5)
  - c (4)
  - C++ (2)
  - Delphi (114)
    - Thread Execution (2)
  - Delphi .Net (8)
  - DotNet (6)
  - FP – Lazarus (3)
  - JAVA (9)
  - Javascript (4)
    - jQuery (1)
  - Pascal (31)
  - pHp (8)
  - PLC (1)
  - Zkoss (1)
- Sistemi Operativi (45)
- Software (32)
- Xtumble (20)
  - XumbleTools (8)
  - XWS (1)
Eventi (3)
Sistemi (50)
- Data Center (11)
  - Server Config (10)
- Firewall (5)
- KVM (11)

PDF to Semantic Text