Jump to content

Kā noteikt faila kodējumu?


Mezavecis
 Share

Recommended Posts

Sveiki, tā teikt ir izniruši failiņi no vecas DB, kuriem nekādīgi nekādīgi neizdevās noteikt kodējumu. It kā vajadzētu būt Windows-1257, bet nav.

 

Mošk kādam ir idejas, kādi tūļi. Vēru vaļā ar IE, Firefox, FAR un īsti gudrs netiku un visus iespējamos variantus izmēģināju. Pielikumā ir mazs failiņš, kuram ir jāparādās ar visām garumzīmēm.

 

fails.txt

Link to comment
Share on other sites

Ja būtu zināms, no kā konvertēt, tā iestādu opcijās vajadzīgo kodējumu un aiziet - konvertēšana nav nepieciešama.

 

Vispār man te nesen arī atsūtīja lietuvieši failus, kuriem kodējumu atrast neizdevās. Tad mošk kāds krutāks tūlis, kas to spēj.

Link to comment
Share on other sites

Bez Windows-1257 ir vēl dažas citas arhaiskas LV kodu tabulas. Šķiet, šī būs viena no tām. Vienkāršākais, ko vari darīt - nosaki, kurš kods atbilst kuram burtam, un uztaisi pats maziņu softiņu, kas tos failus pārkonvertē...

Link to comment
Share on other sites

Tak nospļauties uz to kodējumu.

Repleiso sliktos simbolus uz normāliem. Daudziem vārdiem tak var redzēt kādiem simboliem ir jābūt..

Ar word failiem problēma risinās ~3min laikā izmantojot find & replace all

Kopēju slikto simbolu. Peistoju meklēt logā.. replace logā ierakstu ko vajag.. replace all.

Un tā visus burtus ar mīkstinājumu vai garumzīmi.

Ātri un vienkārši.

Gan jau ka ar to tavu failu var līdzīgi :)

Link to comment
Share on other sites

Velis, tu zin kādu progu es cepinu :) Ja replace all komanda derētu, tad viss būtu labi. Vienreiz šitais joks iet cauri, līdz brīdi, kad tiek eksportēti jauni dati ar to pašu marazmātisko kodējumu.

 

Tad kāds varētu būt kodējums šitam pielikumā esošam failam?

Link to comment
Share on other sites

Tie kuriem FARā uzspiežto F8 rāda.. nonunicode laikam ir Latvian.

 

Mežaveci

Man ir bail iedomāties ar kādiem gļukiem man būs jācīnās :D

Edited by Velis
Link to comment
Share on other sites

Nu nez vai tu kodējumu tam failam noteiksi... Drīzāk variants, ka tiek uzrakstīts skripts, kas automātiski veic find/replace darbības (macro komanda wordā, piemēram, vai kas advancētāks...). Kaut kas ļoti nejēdzīgs izskatās... :roll:

Link to comment
Share on other sites

Nedaudz noskaidroju, ka tas ir kaut kāds CP866_ep kodējums.

 

Var izstiepties vai sarauties, bet nekādīgi pagaidām neizdodas dabūt klāt tik vecu kodējumu, un alternatīvu arī neatradu :(

Link to comment
Share on other sites

Vilx-, zini vairākus megabaitus regulāri dzenāt caur konvertoru nav tolks. Laiks ir nauda :)

 

Būs jāgriežas pie šo faila autora, lai uztaisa kaut ko modernāku.

Edited by mezhavecis
Link to comment
Share on other sites

Varbūt LPSR kodējums (standarta Nr. neatceros), kurā, vienā lappusē bija gan kirilica, latviešu burti? Ja tā, tad ir dosiska programmiņa, kurai klāt ir attiecīga atbilstības tabula, lai nokonvertētu. Piedāvāt varu tikai vakarā, kad mājās arhīvā atradīšu. Ja autoram vajag ātrāk, jāraksta proga pašam, nav jau grūti (ja prot).

 

Mezhavecis- nevajag jau dzenāt šurpu turpu, nokovertē un lieto Windowziskā izskatā.

Link to comment
Share on other sites

Ir atrasts

MS-DOS ( PC-8 )

atver

Modris Kundziņš

Silvija Grāvīte

Irēna Sileniece

Guntars Riekstiņš

Ēriks

Lāsma

 

 

DER?

Edited by Nicho
Link to comment
Share on other sites

Rezultāts der, bet šito javā nez kā minēto kodējumu iemānīt iekšā. Konvertoru šausmīgi negribās taisīt.

 

Mēģināju modificēt charsets.jar papildinot ar savējo, bet šis bļauj, ka nesupportēts kodējums :(

Link to comment
Share on other sites

Arī iekš Javas var uztaisīt šausmīgi elementāru un ļoti ātrdarbīgu konvertoru. Viena funkcija, kurai Tu padod faila saturu kā baitu masīvu, un kura ārā dod konvertētu baitu masīvu - kuru tālāk var pārveidot par stringu. Vai pat uzreiz stringu dod ārā.

 

Darbības princips - masīvs ar 256 elementiem. Ciklā ejam cauri visiem faila baitiem, un baita vērtību izmantojam kā indeksu masīvā. Attiecīgais masīva elements savukārt satur konvertēto simbolu. Nekas ātrdarbīgāks principā nav iespējams, un ērtāk lietojamu funkciju arī nevaru iedomāties.

Link to comment
Share on other sites

Vilx-, tavs ieteikums labi strādā, tencinu.

Turklāt iebaroju tam savu kodējumu kā cp866.jar :)

Link to comment
Share on other sites

Ir manīta līdzīga problēma...

Veru vaļā failu ar Excelli vai Accessu un ar Find & Replace (ctrl+h) opciju nomainu visus burtus. Man ir tabula kurā ir norādīts kurš burts atbilst kuram. Ļoti pieļauju, ka tas ir Access 97 fails...un atvērt bez problēmām tu varēsi tikai ar viņu, jo 97 Access nav Unicode....

P.S. Neesmu specs, bet vismaz es tā šo problēmu risinu....

Link to comment
Share on other sites

  • 12 years later...

Blast from past.

Arī uzrāvos uz šādu problēmu, ka vecie txt faili nav salasāmi.

Te pielikumā ar Code Page Editor izveidoju custom NLS failu, kas pieliek 3012 kodējumu iekš tā Windows. 3012 kodējums saukts arī par 866-latvian, LV8RST104090, RST 1040-90, RusLat DOS,PC-8/LR, MS-DOS ( PC-8 ), CP866+LV, LVS8-92, LVS24:93, FreeDOS cp61282(cp-61282)

 

  1. Atarhivē arhīvu
  2. iekopē c_3012.nls uz %windir%\system32
  3. Palaiž un importē Codepage-866Latvian.reg
  4. Pārstartē datoru
  5. Kodējums 3012 parādīsies kā papildus izvēle teksta redaktoros, kas ļauj mainīt encoding.

 

Codepage-866Latvian-NLS.zip

Edited by Kanibaals
Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...