Questo sito utilizza cookies solo per scopi di autenticazione sul sito e nient'altro. Nessuna informazione personale viene tracciata. Leggi l'informativa sui cookies.
Username: Password: oppure
Tutto e di + - CSV: ambiguità nel formato?
Forum - Tutto e di + - CSV: ambiguità nel formato?

Avatar
AldoBaldo (Member)
Guru


Messaggi: 699
Iscritto: 08/01/2015

Segnala al moderatore
Postato alle 22:50
Sabato, 27/08/2016
Avendo riscontrato alcuni "problemini" nella mia classe CSV, ho pensato di riscriverla pressoché da zero basandomi questa volta su quello che spero essere uno standard attendibile. Il riferimento che avrei scelto è il CSV RFC4180, che chiede di rispettare alcune caratteristiche elencate (tra l'altro) qui: http://www.ietf.org/rfc/rfc4180.txt

Sono a buon punto e le cose sembrano funzionare a dovere, se non che una della specifiche del formato è enunciata in un modo che trovo non sufficientemente esplicito. In particolare:

"Spaces are considered part of a field and should not be ignored."

Non sembra niente di strano, e non lo è finche ci si limita a cose tipo...

"....ciao mamma...." (i punti rappresentano gli spazi, per renderli visibili)

Gli spazi sono tra virgolette e non mi passa neanche per la testa di eliminarli.

....ciao mamma....

Anche qui basta lasciare gli spazi dove sono.

...."ciao ""mamma"" carissima"....

Ma in un caso come questo? Eliminando gli spazi andrebbe tutto bene perché sarebbe un classico campo virgolettato, ma... tenendoli? Quelle virgolette singole come si interpreterebbero? Saltandole facendo finta che non ci siano? Ne risulterebbe un campo che contiene ....ciao "mamma" carissima.....

Qual è l'interpretazione giusta? Togliere gli spazi o ignorare le virgolette singole? Altro?


Ultima modifica effettuata da AldoBaldo il 27/08/2016 alle 22:50


ATTENZIONE! Sono un hobbista e l'affidabilità delle mie conoscenze informatiche è molto limitata. Non prendere come esempio il codice che scrivo, perché non ho alcuna formazione accademica e rischieresti di apprendere pratiche controproducenti.
PM Quote
Avatar
lumo (Member)
Expert


Messaggi: 449
Iscritto: 18/04/2010

Segnala al moderatore
Postato alle 18:49
Domenica, 28/08/2016
Dopo una discussione su IRC si è risolto determinando che la stringa proposta da AldoBaldo non è valida in un campo CSV

PM Quote
Avatar
AldoBaldo (Member)
Guru


Messaggi: 699
Iscritto: 08/01/2015

Segnala al moderatore
Postato alle 21:31
Domenica, 28/08/2016
Sì, infatti grazie al tuo aiuto è emerso che queste due affermazioni, se intese in sinergia, comportano che non è proponibile un campo che contemporaneamente si apra e/o chiuda con spazi e comprenda virgolette.

Spaces are considered part of a field and should not be ignored.

If fields are not enclosed with double quotes, then double quotes may not appear inside the fields.

Infatti, se un campo si apre e/o chiude con degli spazi non è enclosed with double quotes (enclosed implica che tutti i caratteri del campo devono essere compresi, non solo alcuni).

Dunque, ...."ciao ""mamma"" carissima".... non è ammissibile e costituisce una condizione d'errore per formato non valido.

Ultima modifica effettuata da AldoBaldo il 28/08/2016 alle 21:32


ATTENZIONE! Sono un hobbista e l'affidabilità delle mie conoscenze informatiche è molto limitata. Non prendere come esempio il codice che scrivo, perché non ho alcuna formazione accademica e rischieresti di apprendere pratiche controproducenti.
PM Quote