запись xml в UTF-8 с BOM

Shtock
Дата: 16.09.2015 13:20:37
Народ, записываю XML в файл, но он пишется без BOM. Есть какие-нибудь настройки, чтобы с BOM его записать?

declare
lFile utl_file.file_type;
pFileName varchar2(30);
pPathvarchar2(30);
      
   XMLForExport xmltype;  
  begin
   select xml 
   into XMLForExport 
   from xml_date;
    
   
   dbms_xslprocessor.clob2file( XMLForExport.getclobval(), pPath, pFileName, nls_charset_id('AL32UTF8')); 
   
    
  end;
Dimitry Sibiryakov
Дата: 16.09.2015 13:34:13

Shtock
записываю XML в файл, но он пишется без BOM.

BOM нужен только для UTF-16. UTF-8 он не нужен. А кодировка XML файла определяется полем в
его заголовке, а не какими-то левыми гаданиями.

Posted via ActualForum NNTP Server 1.5

AlexFF__|
Дата: 16.09.2015 14:03:42
Dimitry Sibiryakov
Shtock
записываю XML в файл, но он пишется без BOM.

BOM нужен только для UTF-16. UTF-8 он не нужен. А кодировка XML файла определяется полем в
его заголовке, а не какими-то левыми гаданиями.

Не только, BOM также может использоваться при определении кодировки.

По теме, добавь ручками.
Dimitry Sibiryakov
Дата: 16.09.2015 14:20:16

AlexFF__|
BOM также может использоваться при определении кодировки.

Как я уже сказал, гадать можно и на кишках свежеубитого чёрного петуха. А ВОМ нужен
исключительно для того чтобы отличить UTF-16LE от UTF-16BE, поскольку без этого невозможно
правильно прочитать первый тэг.

Posted via ActualForum NNTP Server 1.5

AlexFF__|
Дата: 16.09.2015 14:46:44
Dimitry Sibiryakov
AlexFF__|
BOM также может использоваться при определении кодировки.

Как я уже сказал...

Ты сказал ерунду, я тебя поправил.
Определение кодировки текста в файле в общем случае и есть гадание и BOM идет как один из критериев.
-2-
Дата: 16.09.2015 14:49:44
Dimitry Sibiryakov
исключительно
w3c.org
Entities encoded in UTF-16 must and entities encoded in UTF-8 may begin with the Byte Order Mark described by Annex H of [ISO/IEC 10646:2000], section 16.8 of [Unicode] (the ZERO WIDTH NO-BREAK SPACE character, #xFEFF). This is an encoding signature, not part of either the markup or the character data of the XML document. XML processors must be able to use this character to differentiate between UTF-8 and UTF-16 encoded documents.
Dimitry Sibiryakov
Дата: 16.09.2015 16:09:23

-2-
XML processors must be able to use this character to differentiate between UTF-8
and UTF-16 encoded documents.

"Станьте ёжиками". (c)

Как BOM поможет отличить UTF-8 от UTF-16LE?

Posted via ActualForum NNTP Server 1.5

-2-
Дата: 16.09.2015 16:40:07
Dimitry Sibiryakov
Как BOM поможет отличить UTF-8 от UTF-16LE?
EFBBBF <> FFFE