как извлечь текст из xml/html?

  • Автор темы Автор темы Ravl
  • Дата начала Дата начала
1. Сделай такой файлик, напр. c:tempmy.cfg :
----------------------------------------------------
[Config]
OpenInNotepad=1
CharsPerLine=75
Source=C:MyFilesHTML*.html
Dest=C:MyFilestext*.txt
SkipTitleText=0
AddLineUnderHeader=0
SkipTableHeaderText=0
TableCellDelimit=1
HeadingLineChars=======
HorRuleChar==
ListChars=*o-@#
ConvertMode=1
AllowCenterText=0
AllowRightText=0
DLSpc=8
LinksDisplayFormat=%T
EncloseBoldCharsStart=<<
EncloseBoldCharsEnd=>>
EncloseBold=0
SubFolders=0
----------------------------------------------------
2. Замени Source и Dest на свои пути.
3. Запусти из коммандной строки:
htmlastext.exe /run "c:tempmy.cfg"
 
DonPedro
с html понятно, но мне тут нужно еще больше штуки файлов с расширением xml обработать...
 
а, еще трабл - все файлы разложены в разных папках (по 2 файла в папке, 982 папки). как сконвертить файлы в текст прямо в родной папке?
 
<div class='quotetop'>QUOTE(\"Ravel\")</div>
должна справиться?[/b]
А-га.

<div class='quotetop'>QUOTE(\"Ravel\")</div>
как сконвертить файлы в текст прямо в родной папке?[/b]
Не знаю. Думаю, самое быстрое - собрать все в одну, сконвертировать, а потом разбрасывать назад руцями :frown:
 
DonPedro
попробовал твой метод, все заработало!
<div class='quotetop'>QUOTE(\"DonPedro\")</div>
3. Запусти из коммандной строки:
htmlastext.exe /run \"c:tempmy.cfg\"[/b]
в проге есть кнопка "Load Config", которая великолепно загрузила предложенный в 4 посте конфиг :beer: так что даже не пришлось запускать прогу из командной строки
 

Сейчас просматривают