Ковырялся, ковырялся, но так и не наковырял.
В RTF присутствует русский текст, который необходимо перекодировать.
Этот скрипт, что указан выше, только обрезает лишние символы, не перекодируя информацию.
Собственно, строка
| автор |
|---|
{\rtf1\ansi\ansicpg1251\deff0\deflang1049{\fonttbl{\f0\fnil\fcharset0 Microsoft Sans Serif;}} {\*\generator Msftedit 5.41.21.2510;}\viewkind4\uc1\pard\lang1033\f0\fs20 ATM Controller\par } |
логично превращается в
и все прекрасно, но со строкой
| автор |
|---|
{\rtf1\ansi\ansicpg1251\deff0\deflang1049{\fonttbl{\f0\fnil\fcharset204 Microsoft Sans Serif;}{\f1\fnil\fcharset0 Microsoft Sans Serif;}} {\*\generator Msftedit 5.41.15.1515;}\viewkind4\uc1\pard\f0\fs20\'d5\'f0\'e0\'ed\'e8\'eb\'e8\'f9\'e5 \'e4\'e0\'ed\'ed\'fb\'f5 \'c1\'e0\'ed\'ea\'e0\lang1033\f1 (Data Warehouse)\par } |
Такое не прокатит и она превратится в
| автор |
|---|
| d5f0e0ede8ebe8f9e5 e4e0ededfbf5 c1e0edeae0 (Data Warehouse) |
Интересует не просто обрезание символов, а именно перекодировка.