Databáze IATE může být stažena jako TBX Thread poster: Milan Condak
|
InterActive Terminology for Europe Příspěvek (Part of) the IATE database can now be downloaded as a massive TBX! Thread poster: Michael Beijer ze dne 10. července 2014 ... See more InterActive Terminology for Europe Příspěvek (Part of) the IATE database can now be downloaded as a massive TBX! Thread poster: Michael Beijer ze dne 10. července 2014 http://www.proz.com/forum/translator_resources/271879-part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx.html obsahuje odkaz na stránku Download IATE and the IATE extraction tool IATExtract.jar popisující databázi a SW, které je možno stáhnout http://iate.europa.eu/tbxPageDownload.do You can download the file by clicking on the link below. IATE_download_27012015.zip (Publication date: 27/01/2015) Statistics The download file contains 1.3 million entries, 8 million terms in 24 official EU languages. Language Number of terms Czech 28865 (Podle tabulky má méně výrazů než čeština pouze chorvatština.) Poslední příspěvek na ProZ.com je starší než lednová databáze. http://www.proz.com/forum/translator_resources/271879- part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx-page3.html Very useful Oct 20, 2014 - V červenci 2014 jsem si stáhl zazipovaný soubor. Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8. Červencový soubor má 19642 českých výrazů. V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT. Milan ▲ Collapse | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Databáze z listopadu 2016 | Feb 23, 2017 |
Milan Condak wrote: Very useful Oct 20, 2014 - V červenci 2014 jsem si stáhl zazipovaný soubor. Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8. Červencový soubor má 19642 českých výrazů. V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT. Milan Letos jsem vyzkoušel import TBX do demoverze Wordfastu 4 a editaci textového souboru ve Wordfastu Classic. V OmegaT jsem využíval TBX jako glosář nebo jako slovník StarDict. Během pěti dnů jsem udělal pět prezentací. Rekapitulace prezentací o TBX, IATE, EuroVocu a nástrojích Wordfast a OmegaT http://www.condak.cz/nove/2017-02/21/cs/03.html Otázka zní: co je vhodné PEMT, MT, slovník, glosář nebo TM? Můj názor: nejlepší je zdroje konfrontovat a použít terminologii zákazníka. Když je zákazníkem orgán EU jsou k dispozici překladové paměti nebo vícejazyčné náhledy (například DGT, eur-lex nebo IATE) nebo text v cílovém jazyce. Pro prezentaci jsem překládal soubor PDF: Minimální platy v EU http://ec.europa.eu/eurostat/documents/2995521/7860532/3-10022017-AP-EN.pdf V prezentaci jsem se zmínil o překladu "national". Jiný příklad je "United Kingdom": My Memory (Google Translate) překládá jako Velká Británie, EU, například v tiskových zprávách, překládá jako "Spojené království". Takový termín je nutné vložit do glosáře a nesprávný překlad do blacklistu. Terminologie je to, co je definované a závazné. IATE je sbírka možných překladů a výklady významu výrazů a rozpis zkratek = pouhé návrhy. Milan http://www.condak.cz/nove/ | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Databáze ze srpna 2017 | Sep 28, 2017 |
Milan Condak wrote: InterActive Terminology for Europe Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8. Červencový soubor má 19.642 českých výrazů. V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Dnes je státní svátek a tak jsem porovnal dvě informace a opět jsem udělal vlastní pokus. 1. Na stránkách (5,6,7 a 8) jsou k zakoupení glosáře a termbáze pro různé CAT nástroje. https://www.tm-town.com/terminology-marketplace?button=&marketplace_language_pair=All&page=6&search=&seller=428&utf8=✓ Czech to English IATE terminology package 63,769 Term Concepts | 0 sales Czech to English €5.50 general Bilingual files extracted from the European Union’s IATE Termbase and formatted for various CAT-tools. === 2. Na stránce IATE je zdroj všech dat http://iate.europa.eu/tbxPageDownload.do You can download the file by clicking on the link below. IATE_download.zip (Publication date: 18/08/2017) Statistics The download file contains 1.3 million entries, 8 million terms in 24 official EU languages. 3. Porovnal jsem uvedené údaje. Levý sloupec IATE uvádí 38.845 českých termínů. Pravý sloupec TM-town uvádí páry čeština plus další jazyk. Pokud je počet českých výrazů 38.845, tak údaje v pravém sloupci, které jsou větší než 38.845 jsou velmi nepravděpodobné. Language Number of terms IATE TM-town za 5,50 € Czech to XX Bulgarian 41.321 34.313 Czech 38.845 Danish 57.3267 50.641 German 944.297 54.071 Greek 492.120 44.578 English 1.305.010 63.769 Spanish 582.572 49.042 Estonian 47.545 36.100 Finnish 325.975 47.121 French 1.231.278 55.187 Irish 68.990 31.357 Croatian 19.063 15.133 Hungarian 45.090 34.746 Italian 658.604 50.207 Lithuanian 48.848 36.772 Latvian 42.413 34.302 Maltese 55.499 39.836 Dutch 657.496 49.760 Polish 72.413 42.435 Portuguese 484.414 45.816 Romanian 49.942 37.383 Slovak 45.593 37.383 Slovenian 53.290 38.595 Swedish 304.231 40.643 Latin 62.602 Multilinugal 5.540 All 8.256.258 == 4. Extrakce aglicko-české terminologie Stažený zip má velikost 127,136 356 MB. a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek c) do programu TM Lookup jsem naimportoval TMX a vyexportoval soubor TXT v kódování UTF-8; textový soubor má velikost 1,679 MB Tož tak. Abych přidal trochu moravského folklóru. Milan | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Aktualizace souboru IATE z 30.1.2018 | Feb 1, 2018 |
Milan Condak wrote: Language Number of terms Bulgarian 41.321 34.313 Czech 38.845 English 1.305.010 63.769 Polish 72.413 42.435 ... a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek Polský slovník v OmegaT http://www.condak.cz/nove/2018-01/31/cs/00.html 01 IATE - česko-polský soubor TBX 02 TMLookUp, import TMX, export TXT 03 StarDict Editor 04 Glosář a slovník v OmegaT Milan | |
|
|
Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Aktualizace IATE k 29.8.2018 | Oct 20, 2018 |
http://www.condak.cz/nove/2018-10/03/cs/00.html IATE - EN-PT update 2018-08-29 a folha plus TBX, TMX, TXT 01 IATE - update 2018-08 02 Looking for freeware TBX editor 03 Export EN-PT TBX from IATE 04 Projekt PT-CS a folha DGT 05 Projekt PT-EN a folha + IATE TMX 06 Analýza programem JEX 07 Projekt PT-EN a folha + IATE TBX 08 Archivní Eurovoc, pár EN-CS Milan 03.10.2018 (data) publikovano 20.10.2018 -- Postupně TBX, Xbench, TMX, Goldpan, Exel, JEX, eurovoc, OmegaT. Koupenou licenci mám pouze na Exel. | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER eTranslate a změny na webech IATE a EurLexu | Nov 12, 2018 |
Tentokrát jsem terminologii nestahoval, pouze informuji o změnách. Datum posledního sestavení: 08/11/2018. EurLex a IATE používají eTranslate (neuronový překladač EU) a mají aktualizované webové stránky. ======================= 1. https://iate.europa.eu/download-iate Velikost nekomprimovaného souboru: 1,97 gigabytes Velikost komprimovaného (staženého) souboru: 112 megabytes Datum posledního sestavení: 08/11/2018 Statistika Počet hesel: 1.1 MM Termíny: 7.5 MM Jazyky: 26 Bulgarian 45202 Termíny Czech 44047 Termíny Danish 513307 Termíny atd. -- 2. https://iate.europa.eu/home Počet hesel 1 185 876 Počet termínů 8 216 152 O IATE IATE (InterAktivní Terminologie pro Evropu) je terminologická databáze EU. Orgány a agentury EU ji používají již od léta 2004 pro shromažďování, šíření a správu terminologie specifické pro EU. Projekt byl zahájen v roce 1999 s cílem poskytnout webovou infrastrukturu pro všechny terminologické zdroje EU, a tím zlepšit dostupnost a standardizaci informací. 3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky https://iate.europa.eu/search/standard/result/1542058809887/1 3536351 finance EU (1021) [EVROPSKÁ UNIE] komunikační systém [VZDĚLÁVÁNÍ A KOMUNIKACE > komunikace] DOPRAVA (48) ENERGETIKA (66) en Connecting Europe Facility cs Nástroj pro propojení Evropy 3577849 institucionální struktura [EVROPSKÁ UNIE > orgány EU a evropská veřejná služba] en Friends of the Presidency Group (Connecting Europe Facility) cs Skupina přátel předsednictví (Nástroj pro propojení Evropy) === Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály. Milan | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Stav databáze IATE 10/2019 | Nov 2, 2019 |
Milan Condak wrote: 3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály. Milan Z CEF je financován EU Council Presidency https://www.proz.com/forum/post_editing_machine_translation/336184-eu_council_presidency_translator.html Letos jsem TBX stáhl. Extrahoval jsem TBX se 4 jazyky. http://www.condak.cz/nove/2019-10/30/cs/00.html IATE 10/2019 Doména 0416 otevřená v Goldpanu 01 Databáze IATE v říjnu 2019 02 Doména 0416 otevřená v Goldpanu 03 Xbench je pro dva jazyky 04 TMLookup 05 Přidání terminologie do PC Translatoru Konverze TBX a využití bez připojení k internetu. Milan | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Stažení dat z IATE v roce 2021 | Mar 5, 2021 |
IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat. Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat. <... See more IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat. Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat. http://www.condak.cz/nove/2021-02/27/cs/00.html Stažení dat z IATE v roce 2021 IATE nabízí především interaktivní připojení 01 Kam vložit stažená data? 02 V roce 2019 03 Žádost o stažení 04 Počet přeložených položek Milan ▲ Collapse | |
|
|
Milan Condak Local time: 13:14 English to Czech TOPIC STARTER | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Post scriptum k tématu IATE | Apr 8, 2021 |
České části databáze IATE jsem vzhledem k její nevýznamnosti věnoval zbytečně dlouho pozornost. Závěrem komentuji komentáře zahraničních uživatelů. http://www.condak.cz/nove/2021-03/31/cs/00.html Import TBX Struktura souboru TBX 01 Goldpan 02 Heartsome TMX Editor 03 Úplnost dat 04 Xbench Milan | | | Milan Condak Local time: 13:14 English to Czech TOPIC STARTER Heartsome Translation Studio | Apr 27, 2021 |
Milan Condak wrote: 02 Heartsome TMX Editor Podíval jsem se na vlastnosti ikony Heartsome TMX Editor a ve stejné složce jsem našel i odzipované "Heartsome Translation Studio"- Na stránku 02.html jsem přidal obrázky menu: Tools a Databases. http://www.condak.cz/nove/2021-03/31/cs/02.html Na položky Tools jsem už dávno zapomněl. Zdají se být užitečné. Milan | | | There is no moderator assigned specifically to this forum. To report site rules violations or get help, please contact site staff » Databáze IATE může být stažena jako TBX TM-Town | Manage your TMs and Terms ... and boost your translation business
Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.
More info » |
| Trados Studio 2022 Freelance | The leading translation software used by over 270,000 translators.
Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop
and cloud solution, empowering you to work in the most efficient and cost-effective way.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |