中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
作者:
标题: 小说文本分割批处理 上一主题 | 下一主题
aiqian2008
初级用户





积分 35
发帖 22
注册 2008-10-11
状态 离线
『楼 主』:  小说文本分割批处理

————————————————————————
@echo off&color a&setlocal enabledelayedexpansion
::因使用了延迟变量而舍弃了感叹号!!在使用之前先把感叹号转换为其他字符。
::原文件空白行也可以输出   注意:只能分割大文件。
for /f %%i in ('type test.txt^|find /v /c ""') do set num=%%i
:start
cls&echo.
set /p "x= 请输要分成的份数:"
set "errorlevel="
set /a y=%num%/%x%
if errorlevel 2 goto start
echo.正在进行文件分割,请稍候...
set fs=1
for /f "tokens=1* delims=:" %%i in ('findstr /n "." test.txt') do (
    set /a n+=1
    set /a w=!fs!*%y%+1
    if %%i gtr !n! call :loop %%i
    echo.%%j>>"test!fs!.txt"
    if !n! gtr !w! set /a fs+=1
)
echo.文件分割完毕,按任意键退出。&pause>nul
exit

:loop
echo.>>"test%fs%.txt"
set /a n+=1
if %1 gtr %n% goto loop
goto :eof
————————————————————————————

2008-11-10 00:50
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
HAT
版主





积分 9023
发帖 5017
注册 2007-5-31
状态 离线
『第 2 楼』:  

建议少用type

[ Last edited by HAT on 2008-11-10 at 09:40 ]



2008-11-10 09:36
查看资料  发短消息 网志   编辑帖子  回复  引用回复
tireless
银牌会员





积分 2025
发帖 1122
注册 2007-9-5
状态 离线
『第 3 楼』:  

好像用 type 速度反倒比较快哦!

2008-11-10 10:38
查看资料  发短消息 网志   编辑帖子  回复  引用回复
HAT
版主





积分 9023
发帖 5017
注册 2007-5-31
状态 离线
『第 4 楼』:  Re 3楼

楼主是要分割大文本,用type来统计文本行数应该不是最快的方法吧?



2008-11-10 10:41
查看资料  发短消息 网志   编辑帖子  回复  引用回复
tireless
银牌会员





积分 2025
发帖 1122
注册 2007-9-5
状态 离线
『第 5 楼』:  

以下是我用 timeit.exe 测试的数据,分别测试这三条命令:

find /v /c "" 1.txt
2.bat
type 1.txt|find /v /c ""


2.bat 的内容是:

  Quote:
@echo off
for /f %%a in (1.txt) do set /a n+=1
echo %n%

测试结果:

  Quote:
Average for find key over 288 runs

Version Number:   Windows NT 5.1 (Build 2600)
Exit Time:        8:00 am, Monday, January 1 1601
Elapsed Time:     0:00:00.128
Process Time:     0:00:00.059


Average for for key over 288 runs

Version Number:   Windows NT 5.1 (Build 2600)
Exit Time:        8:00 am, Monday, January 1 1601
Elapsed Time:     0:00:00.024
Process Time:     0:00:00.037


Average for type key over 288 runs

Version Number:   Windows NT 5.1 (Build 2600)
Exit Time:        8:00 am, Monday, January 1 1601
Elapsed Time:     0:00:00.106
Process Time:     0:00:00.046

按想象我也认为直接 find 速度更快,而经由 type 再管道给 find 更慢。但测试下来,我测试了一个 4MB 的文本,感觉是 type 的快一些,不太相信,于是用 timeit 计算了下,确实是这样。

[ Last edited by tireless on 2008-11-10 at 10:48 ]

2008-11-10 10:43
查看资料  发短消息 网志   编辑帖子  回复  引用回复
aiqian2008
初级用户





积分 35
发帖 22
注册 2008-10-11
状态 离线
『第 6 楼』:  

谢谢大家的提醒,这的确是个问题,我重新考虑考虑
5楼的2.bat 会漏掉空白行,达不到效果

2008-11-10 21:51
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: