Board logo

标题: 批处理室经典帖子索引初步整理结果[20070211更新] [打印本页]

作者: namejm     时间: 2007-2-7 01:51    标题: 批处理室经典帖子索引初步整理结果[20070211更新]

  整理批处理室的经典帖子这个想法很早之前就有人提出来了,只是那时候还没太多的时间,导致此事的搁浅。1月初,在wengier站长的持续更新和qzwqzw等人的辛勤测试下,论坛的DOS界面开发工作进展得很顺畅,极大地方便了帖子标题记录的提取工作,从而为建立批处理室经典帖子索引创造了便利的条件。

  从1月下旬起,本人开始着手整理批处理室经典帖子索引,但是中途诸事缠身,整理工作中断了一些时日,前两天才接着做下去,今天终于赶出了初稿,放出来让大家来讨论一下,看看该如何做进一步的完善。

  说一下我的收录标准:
  ① 对某一问题做深入分析、讨论的帖子;
  ② 关注程度很高、实用性/通用性很强的帖子;
  ③ 技巧性较高或思路/见解独到的帖子;
  ④ 提供不同思路/不同脚本工具编写代码的帖子

  因为只是个初稿,提供两个版本的整理结果:考虑到整理的方便,”分类整理初步(详细).txt“只保留了帖子的创建时间、ID、回帖量、浏览量、标题等关键内容,没有加上论坛的链接,但是可以通过 http://www.cn-dos.net/forum/viewthread.php?tid=ID号 的方式访问;考虑到查看帖子内容的方便,“分类整理初步(带链接版).txt”只提供了链接和标题。既然是初稿,那么,肯定会存在很多不足,比如分类不尽合理,还有可增/删/调整的地方;比如同类帖子可能存在内容上的重复,还可以去粗取精……请大家多提建议,把这个帖子索引做成批处理室的精品。

  目前,初步的想法是:
  ① 把索引分类更加合理化;
  ② 数量尽量精简,同类帖子只选取具有代表性的发出来;
  ③ 发表出来的索引帖做成这样: [推荐]DOS联盟论坛解答室精华帖索引(2005.08.10),但是,会以分类的形式张贴,并通过添加颜色、改变字体字号等手段加以区别。

  感谢 ccwan 在分类方面的建议;感谢 jmz573515 在版本内容方面的建议。
附件 1: 批处理室经典帖子初步整理结果.rar (2007-2-11 14:29, 31.44 K, 下载附件所需积分 1点 ,下载次数: 151)

作者: redtek     时间: 2007-2-7 02:07
超级顶!!!真是太好了~:)))
作者: namejm     时间: 2007-2-7 02:12


  Quote:
Originally posted by redtek at 2007-2-6 13:07:
超级顶!!!真是太好了~:)))

  期待你的建议。
作者: redtek     时间: 2007-2-7 02:25
namejm兄总是这么谦虚~:)

盼着DOS联盟论坛dos批处理室精华帖索引帖闪亮的挂在论坛的《重要主题》区上~:)
作者: qingfushuan     时间: 2007-2-7 04:37    标题: 顶哦

顶你个肺
顶你个心子把把哦
作者: vkill     时间: 2007-2-7 05:21
这个很很好
作者: namejm     时间: 2007-2-8 01:38
  为了能让索引尽早发布,方便大家的学习,希望各位不要袖手旁观。
作者: anqing     时间: 2007-2-8 01:53
这个挺实用的
作者: 无奈何     时间: 2007-2-8 02:35
非常不错!
建议发布索引的时候附带上发帖时间,如 tid=13226 那帖的样子,namejm 兄 现在整理保留的是最后回复时间,好像这个时间意义不大。
作者: namejm     时间: 2007-2-8 02:53


  Quote:
Originally posted by 无奈何 at 2007-2-7 13:35:
建议发布索引的时候附带上发帖时间,如 tid=13226 那帖的样子,namejm 兄 现在整理保留的是最后回复时间,好像这个时间意义不大。

  如顶楼所说的,发布索引的格式参考的是解答室那个置顶索引帖的格式,会带上发帖时间的,并且我目前放出来的这个初步整理结果里保留的也是发帖时间而不是最后回复时间,无奈何 兄可能看走眼了。

[ Last edited by namejm on 2007-8-13 at 01:56 PM ]
作者: 无奈何     时间: 2007-2-8 03:35
namejm 兄 不好意思,我只是粗粗的看了一下。
分类确实是个头疼的问题,分类过粗,会显得很杂;分类过细,帖子置于哪个分类不好判断。相比还是细些分类好点,现在缺乏系统合理的分类表,希望大家能一起讨论一下。
作者: qzwqzw     时间: 2007-2-8 05:27
其实可以不必太讲究分类法

因为很多内容都是无法归类的

可能既属于A,又属于B,同时与C又有关系

关键是要让人可以快速的找到他所需要的内容

所以建立索引的意义大于建立分类

索引中最有效也最常用的无疑是关键字索引

而关键字的建立和选取就简单得多

可以从内容中提取高频字词

也可以从内容中概括关键字

-------------------------------------------------------

另外有一个初步的设想——

因为关键字的优劣取决于定位的准确性与用户的关注程度

因此可以考虑随着用户的选择而动态的优化索引

不断增设新的关键字及其索引

汰除旧的关键字及其索引

这个过程应该是可以自动实现的

关键是采用何种方式收集和反馈用户的选择行为
作者: 无奈何     时间: 2007-2-8 07:31


  Quote:
Originally posted by qzwqzw at 2007-2-8 05:27:
因此可以考虑随着用户的选择而动态的优化索引

兄的提议很好,动态索引由于我不懂 javascript 等,实现会很困难。也请懂 javascript 的朋友指点一下是否可行。

我考虑的方案是 制作出 chm 文件,在本机架设微型的 apache + php 接受用户提交的关键字、分类信息等,然后统一收集每个用户的提交信息,最后制作带分类及索引的 chm 文件。这样怎么也做不到真正的动态,不能随用户的整理随时更新。
再进一步的话用脚本生成 chm 编译所需的文件,让用户自己编译出 chm 文件。
作者: namejm     时间: 2007-2-8 13:54


  Quote:
Originally posted by qzwqzw at 2007-2-7 16:27:
其实可以不必太讲究分类法
因为很多内容都是无法归类的
可能既属于A,又属于B,同时与C又有关系
关键是要让人可以快速的找到他所需要的内容
所以建立索引的意义大于建立分类

  有些内容确实是难以精确归类,但是我觉得分类的工作还是应该去做,因为按照目前初步整理的结果,经典帖子标题有400余条,如果不分门别类地放好而是全部放在一起的话,找自己感兴趣的内容会十分吃力的——为了降低整理强度和难度,目前我只想把帖子标题列出来,用户点击就跳转到这个帖子,做的是标题列表索引而非全文关键字索引。

  当然,如果能有办法做出关键字索引的话,那将是论坛里的一大幸事,只可惜以我的水平,还做不了这个高难度的项目,只有指望其他人了
作者: jmz573515     时间: 2007-2-10 00:57
不知道这样能不能给各位带来方便
附件 1: 搜索DOS论坛.rar (2007-2-10 00:57, 76.35 K, 下载附件所需积分 1点 ,下载次数: 68)

作者: piaoye0605     时间: 2007-2-10 04:23
向前辈们学习
作者: qzwqzwtest     时间: 2007-2-10 12:52
偶然看到这样的文字

摘抄下来

http://mingxinzhicheng.blog.51cto.com/post/16/2981

  Quote:
Tag(标签)是一种更为灵活、有趣的日志分类方式,您可以为每篇日志添加一个或多个Tag(标签),然后您可以看到BlogBus上所有和您使用了相同Tag的日志,并且由此和其他用户产生更多的联系和沟通。不仅如此,我们还通过与Technorati的合作,把您的Tag发送到全球Blog空间,和全世界的人们共同分享。

Tag体现了群体的力量,使得日志之间的相关性和用户之间的交互性大大增强,可以让您看到一个更加多样化的世界,一个关联度更大的Blog空间,一个热点实时播报的新闻台。Tag为您提供前所未有的网络新体验。当然,您也可以简单地把一个Tag(标签)理解为一个日志分类,但是Tag和分类的不同之处也很明显:首先,分类是您在写日志之前就定好的,而Tag是在您写完日志之后再添加的;其次,您可以同时为一篇日志贴上好几个Tag(标签),方便自己随时查找,而原先一篇日志只能有一个分类;再次,当您积累了一定数量的Tag之后,您可以看看自己在Blog中最经常写的是哪些话题;最后,您可以看到有哪些人和自己使用了一样的Tag(标签),进而找到和您志趣相投的Blogger。


作者: electronixtar     时间: 2007-2-11 04:28
tag就算了,这个太超前了。目前比较现实的就是弄一个 wiki
作者: namejm     时间: 2007-2-11 14:19
  分类索引已经做出来了,只是一个初步的结果,请点击 批处理室经典帖子分类索引 查看效果。若有什么建议,请在本主题下发表。

[ Last edited by namejm on 2007-2-12 at 06:33 PM ]
作者: electronixtar     时间: 2007-2-11 14:34
namejm辛苦啦~~
作者: bbq123bbq     时间: 2007-2-11 16:26
支持........
作者: namejm     时间: 2007-2-12 11:36
  哎,大家都光说不练,失望。
作者: qasa     时间: 2007-2-12 12:58
建议版主把该贴固顶:

http://www.cn-dos.net/forum/viewthread.php?tid=27617
作者: namejm     时间: 2007-2-12 13:28
  置顶的帖子一向是没多少人关注的,我还是经常来这里炒下冷饭吧。
作者: bjanwxf     时间: 2007-2-13 05:16
楼主真是好人啊
作者: namejm     时间: 2007-2-13 07:11
  经典帖子索引 这个帖子已经开放了回复功能,请各位到 这里 发表建议,谢谢。

[ Last edited by namejm on 2007-2-12 at 06:32 PM ]
作者: gne3     时间: 2007-2-25 07:50
15楼的我下了你的,谢谢
作者: fm8477     时间: 2007-8-13 12:12
太好了,多谢楼主了!!
作者: enjoyer     时间: 2007-9-7 12:54    标题: 按涉及到的主题分类

如果一个文章有交叉了n个主题,那就使这篇文章能在N个分类主题中都索引到.原文章只留一份即可.
作者: binggao     时间: 2007-9-30 08:49
整理成  书就好了
作者: dxt1988     时间: 2007-10-8 01:03
好东西
作者: scrate     时间: 2007-10-12 21:58
建议论坛应该有一个精确的帖子标签分类定义。我的意思是,有最好的精华,一般性的精华,差一点的精华。值得看一眼的,值得推荐的,种种,然后在版面上有一个标签选择。这样,我们每到一个分版,只要一点这个标签就能找到了我们需要的精华内容了
作者: Vortex     时间: 2007-10-28 16:35
整理得实在太好了!!谢谢了!
作者: dthao     时间: 2007-11-3 00:29
支持`顶
作者: bileliang     时间: 2007-11-9 13:26
分类有时候的确不太好把握
作者: lijinying     时间: 2007-11-22 21:23
EPoX-NF2 UltraG/NF3 250GB主板Raid实战
作者: bobok     时间: 2008-1-1 14:45    标题: 好东西。

真是好东西
作者: student007     时间: 2008-1-13 10:30
想下为学习..
还需积分
作者: wanlongwyp     时间: 2008-2-2 12:04
好东西,下载看看。
作者: the6yifu     时间: 2008-3-18 21:34
如何下啊 没有积分啊
作者: Jeasky     时间: 2008-3-28 18:50
学习Dos
找到好学堂了

接下来,,修行靠个人儿了
作者: pykacha     时间: 2008-5-22 08:55
谢谢啦
作者: dos123456789     时间: 2008-7-20 12:26
好方便的东西 。强烈需要
作者: solidyjd     时间: 2008-8-17 19:18
太好了,多谢
作者: fengganjing     时间: 2008-9-24 11:44
新手 ,希望能学习到东西
作者: haiy     时间: 2008-10-10 15:56
很好 谢谢
作者: laihaibin08     时间: 2008-10-19 17:55
谢谢
收藏了
作者: wangking2008     时间: 2008-10-30 10:05
好!!!!
作者: x58397313     时间: 2008-11-2 08:05    标题: 111111

1111111111
作者: lionlove     时间: 2009-5-25 22:57
很好的东西,顶
作者: jhg1975     时间: 2010-9-22 22:48
参考下
作者: lmlz41     时间: 2010-10-29 14:16
拿了东西顶一下!初级、中级DOS必来的地方啊!
作者: weilu     时间: 2010-11-15 11:55
这个要支持啊,不错