Regex for first lowercase letter

If you have en ebook that split badly a paragraph, you can try (to merge the bad splitted paragraph), as find

</p>\n\n\s\s<p>([a-z])

so that a paragraph beginning with a lowercase word be merged with the previous one.

But in Calibre editor you must check “case sensitive”, otherwise [a-z] will be read as [A-Z], and all first letters (lower and upper case) will be selected.

And as replace you could try

 \1

In this way you keep whatever letter is found with ([a-z]) in the result.

Regex for “space”

It can happen that you want replace a double space before <p>: use the \s. I.g. to replace

,</p>

<p>

You should use this find: ,</p>\n\n\s\s</p>

creare il sommario di un file epub (da rtf o html)

Per chi ha un lettore di e-book un sommario è cosa quantomai utile. Se uno scarica da web un file epub già bell’e pronto si suppone che abbia un sommario.
Ma i problemi cominciano se uno deve trasformare in epub un file rtf o html (operazione che si rende quantomai opportuna perché certi lettori di e-book non leggono bene l’html e meno che mai l’rtf, ad esempio i caratteri non-ascii).
Calibre trasforma un rtf o un html in epub, ma non crea correttamente il sommario. Ad esempio di un file html estrae come voci di sommario tutti i links, il che è francamente demenziale. Di un rtf non sa trarre le voci del sommario, né usando lo stile “intestazione” né usando lo stile “indice”; a nulla serve dirgli i tag negli appositi spazi.

Allora si può cercare da agire sul programma di videoscrittura, LibreOffice. Abbiamo provato eLaix. La prima volta abbiamo dovuto constatare che la dimensione del font era talmente piccola (pur essendo settato su 12pt) da rendere impossibile la lettura sull’e-reader. Abbiamo provato un seconda volta, aumentando il font sul file rtf e settando giusto l’allineamento. Il font risulta corretto, ma sul nostro Pyrus, incredibilmente in contrasto con il css, il tipo di carattere e l’allineamento restano splendidamente immutati al variare delle istruzioni. Ma la colpa non di eLaix bensì del Pyrus. ELaix comunque crea correttamente il sommario.
Diciamo in sintesi: se la formattazione non è un problema, ma avete necessità di creare un sommario epub da un file rtf, eLaix può esservi utile.

Ma la soluzione più completa ho trovato essere il programma, grauito, ma interessantissimo, Sigil, con cui si può editare sotto ogni aspetto un file epub (o html trasformandolo in epub con sommario desunto dai titoli h1, h2, ecc.).