Jump to content
Sign in to follow this  
Mezavecis

Kā noteikt faila kodējumu?

Recommended Posts

Mezavecis

Sveiki, tā teikt ir izniruši failiņi no vecas DB, kuriem nekādīgi nekādīgi neizdevās noteikt kodējumu. It kā vajadzētu būt Windows-1257, bet nav.

 

Mošk kādam ir idejas, kādi tūļi. Vēru vaļā ar IE, Firefox, FAR un īsti gudrs netiku un visus iespējamos variantus izmēģināju. Pielikumā ir mazs failiņš, kuram ir jāparādās ar visām garumzīmēm.

 

fails.txt

Share this post


Link to post
Share on other sites
mafijs

DOS_iskais ASCII ??

Share this post


Link to post
Share on other sites
Guest Velis

A nospļauties un pārkonvertēt uz ko vajag nevar ?

Share this post


Link to post
Share on other sites
Mezavecis

Ja būtu zināms, no kā konvertēt, tā iestādu opcijās vajadzīgo kodējumu un aiziet - konvertēšana nav nepieciešama.

 

Vispār man te nesen arī atsūtīja lietuvieši failus, kuriem kodējumu atrast neizdevās. Tad mošk kāds krutāks tūlis, kas to spēj.

Share this post


Link to post
Share on other sites
Vilx-

Bez Windows-1257 ir vēl dažas citas arhaiskas LV kodu tabulas. Šķiet, šī būs viena no tām. Vienkāršākais, ko vari darīt - nosaki, kurš kods atbilst kuram burtam, un uztaisi pats maziņu softiņu, kas tos failus pārkonvertē...

Share this post


Link to post
Share on other sites
mafijs

FAR man rāda visu kā vajag.

Total comandera iebūvētajam vieweram pasaku ASCII un arī viss rādās kā vajag.

Share this post


Link to post
Share on other sites
Guest Velis

Tak nospļauties uz to kodējumu.

Repleiso sliktos simbolus uz normāliem. Daudziem vārdiem tak var redzēt kādiem simboliem ir jābūt..

Ar word failiem problēma risinās ~3min laikā izmantojot find & replace all

Kopēju slikto simbolu. Peistoju meklēt logā.. replace logā ierakstu ko vajag.. replace all.

Un tā visus burtus ar mīkstinājumu vai garumzīmi.

Ātri un vienkārši.

Gan jau ka ar to tavu failu var līdzīgi :)

Share this post


Link to post
Share on other sites
Mezavecis

Velis, tu zin kādu progu es cepinu :) Ja replace all komanda derētu, tad viss būtu labi. Vienreiz šitais joks iet cauri, līdz brīdi, kad tiek eksportēti jauni dati ar to pašu marazmātisko kodējumu.

 

Tad kāds varētu būt kodējums šitam pielikumā esošam failam?

Share this post


Link to post
Share on other sites
Guest Velis

Tie kuriem FARā uzspiežto F8 rāda.. nonunicode laikam ir Latvian.

 

Mežaveci

Man ir bail iedomāties ar kādiem gļukiem man būs jācīnās :D

Edited by Velis

Share this post


Link to post
Share on other sites
mafijs

Es palieku pie ASCII . Iespējams, ka tā datu bāze taisīta ar vecu FoxPro (DOS_isko)

Share this post


Link to post
Share on other sites
Val

moš saglabājot failu viss kodējums kaķim zem astes?

Share this post


Link to post
Share on other sites
Uģis Lācis

Nu nez vai tu kodējumu tam failam noteiksi... Drīzāk variants, ka tiek uzrakstīts skripts, kas automātiski veic find/replace darbības (macro komanda wordā, piemēram, vai kas advancētāks...). Kaut kas ļoti nejēdzīgs izskatās... :roll:

Share this post


Link to post
Share on other sites
Nicho

Varu ieteikt, ka daži simboli sakrīt ar 1256 Windows Arabic, ja č iet tev kā j, tad saku ka 70%

Share this post


Link to post
Share on other sites
Mezavecis

Nedaudz noskaidroju, ka tas ir kaut kāds CP866_ep kodējums.

 

Var izstiepties vai sarauties, bet nekādīgi pagaidām neizdodas dabūt klāt tik vecu kodējumu, un alternatīvu arī neatradu :(

Share this post


Link to post
Share on other sites
Vilx-

Vai uztaisīt pašam savu konvertorprogrammiņu tiešām nav opcija?

Share this post


Link to post
Share on other sites
Mezavecis

Vilx-, zini vairākus megabaitus regulāri dzenāt caur konvertoru nav tolks. Laiks ir nauda :)

 

Būs jāgriežas pie šo faila autora, lai uztaisa kaut ko modernāku.

Edited by mezhavecis

Share this post


Link to post
Share on other sites
učuks

Varbūt LPSR kodējums (standarta Nr. neatceros), kurā, vienā lappusē bija gan kirilica, latviešu burti? Ja tā, tad ir dosiska programmiņa, kurai klāt ir attiecīga atbilstības tabula, lai nokonvertētu. Piedāvāt varu tikai vakarā, kad mājās arhīvā atradīšu. Ja autoram vajag ātrāk, jāraksta proga pašam, nav jau grūti (ja prot).

 

Mezhavecis- nevajag jau dzenāt šurpu turpu, nokovertē un lieto Windowziskā izskatā.

Share this post


Link to post
Share on other sites
Nicho

Ir atrasts

MS-DOS ( PC-8 )

atver

Modris Kundziņš

Silvija Grāvīte

Irēna Sileniece

Guntars Riekstiņš

Ēriks

Lāsma

 

 

DER?

Edited by Nicho

Share this post


Link to post
Share on other sites
Mezavecis

Rezultāts der, bet šito javā nez kā minēto kodējumu iemānīt iekšā. Konvertoru šausmīgi negribās taisīt.

 

Mēģināju modificēt charsets.jar papildinot ar savējo, bet šis bļauj, ka nesupportēts kodējums :(

Share this post


Link to post
Share on other sites
Nicho

Nezinu kā tieši pacelsi, bet varētu domāt par exportu no MS Office, par cik MS-DOS PC-8 iet ar office standartaa..

Share this post


Link to post
Share on other sites
Vilx-

Arī iekš Javas var uztaisīt šausmīgi elementāru un ļoti ātrdarbīgu konvertoru. Viena funkcija, kurai Tu padod faila saturu kā baitu masīvu, un kura ārā dod konvertētu baitu masīvu - kuru tālāk var pārveidot par stringu. Vai pat uzreiz stringu dod ārā.

 

Darbības princips - masīvs ar 256 elementiem. Ciklā ejam cauri visiem faila baitiem, un baita vērtību izmantojam kā indeksu masīvā. Attiecīgais masīva elements savukārt satur konvertēto simbolu. Nekas ātrdarbīgāks principā nav iespējams, un ērtāk lietojamu funkciju arī nevaru iedomāties.

Share this post


Link to post
Share on other sites
Mezavecis

Vilx-, tavs ieteikums labi strādā, tencinu.

Turklāt iebaroju tam savu kodējumu kā cp866.jar :)

Share this post


Link to post
Share on other sites
Russo

Ir manīta līdzīga problēma...

Veru vaļā failu ar Excelli vai Accessu un ar Find & Replace (ctrl+h) opciju nomainu visus burtus. Man ir tabula kurā ir norādīts kurš burts atbilst kuram. Ļoti pieļauju, ka tas ir Access 97 fails...un atvērt bez problēmām tu varēsi tikai ar viņu, jo 97 Access nav Unicode....

P.S. Neesmu specs, bet vismaz es tā šo problēmu risinu....

Share this post


Link to post
Share on other sites
Kanibaals

Blast from past.

Arī uzrāvos uz šādu problēmu, ka vecie txt faili nav salasāmi.

Te pielikumā ar Code Page Editor izveidoju custom NLS failu, kas pieliek 3012 kodējumu iekš tā Windows. 3012 kodējums saukts arī par 866-latvian, LV8RST104090, RST 1040-90, RusLat DOS,PC-8/LR, MS-DOS ( PC-8 ), CP866+LV, LVS8-92, LVS24:93, FreeDOS cp61282(cp-61282)

 

  1. Atarhivē arhīvu
  2. iekopē c_3012.nls uz %windir%\system32
  3. Palaiž un importē Codepage-866Latvian.reg
  4. Pārstartē datoru
  5. Kodējums 3012 parādīsies kā papildus izvēle teksta redaktoros, kas ļauj mainīt encoding.

 

Codepage-866Latvian-NLS.zip

Edited by Kanibaals
  • Atbalstu 1

Share this post


Link to post
Share on other sites
ieleja

to ciparu 866 esmu redzējis saistībā ar Epson adatu printeriem

 

es vienai jaudīgai DOSiskai uzskaites sistēmai izmantoju kaut kādu modificētu “cp775lv.nls” failu, jo iedzimtie Windows līdzekļi nedod vajadzīgo

 

tur gan neaktuāli Rus burti

Share this post


Link to post
Share on other sites
Kanibaals

vēsturei vari nopublicēt arī to. 866 ir kirilicai un balstīts uz 437, tā kā tas negarantē latviešu burtus.

Share this post


Link to post
Share on other sites
ieleja

manam failam ir zināms un ne mans (c) un (r), tāpēc apzināti nepublicēju

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...
Sign in to follow this  

×
×
  • Create New...