前の月 / 次の月 / 最新

hiChangeLog / 2007-12

2007-12
SMTWTFS
1
2345678
9101112131415
16171819202122
23242526272829
3031

2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12

2007-12-31 Mon

python-modeのpy-help-at-pointを使う [python][Emacs]

python-modeで C-c C-h とすると py-help-at-point が使えると python-mode on emacs 環境向上計画から学んだ。py-help-at-pointとはカーソルのあたりにあるキーワードのヘルプを表示してくれる機能。ただ「sourceforge.net配布のではなぜかうまく動かないのでpythonソース付属のものを使ってます。」とある。実際やってみたらそうだったので手順などをメモ。

「sourceforge配布」とはこちらのもの:http://sourceforge.net/projects/python-mode本家より"collection of Emacs packages"として辿れる。
一方で、pythonソースも勿論本家より入手できる。私は2.5.1のものをダウンロードしたがMiscディレクトリの中にあった。11行目の記述は以下の通り。

(defconst py-version "$Revision: 34960 $"
これをsite-lispディレクトリとかに放り込めばpython-mode自体のインストールは終わる。

ただ私の環境(WinXP + Python 2.4.4)では、helpを見るためにはhelp自体のインストールも必要であった。
まず本家の2.4.4ドキュメント配布ページよりHTML形式のものを入手する。
上記配布ページはやや行きにくかった。まずただのドキュメント配布ページに行き、Download Current Documentationlを選択し、左からOlder versionsを選択することでようやく辿り着けた。
上記ドキュメントを展開し、適当な場所に置いた上で、環境変数PYTHONDOCSに C:\Python24\html などと設定する。

以上で C-c C-h が機能するようになったので、正しく設定できたようである。

2007-12-21 Fri

HTMLからアンカー(リンク)を抽出する (その2) [python][正規表現]

[2007-12-14-1]に、pythonで正規表現HTMLからアンカー(リンク)を抽出する方法をメモした。
我ながら不恰好なスクリプトだなと思っていたが、案の定もっと洗練された方法があった。

import re

s = open('hoge.html', 'r').read()
reg = re.compile(r'<a href="(\S+?\.pdf)">(.+?)</a>')
for r in reg.finditer(s):
    print 'wget %s' % r.group(1)

参考:Pythonプログラミング:14

2007-12-19 Wed

DXF、DWGファイルの無償ビューア "DWG TrueView"なるものを見つけた

部品の図面をDXFファイルで配布してくれるメーカーが多い。これまでIllustrator CSで見ていたが、うまく開けないことも多くムカつくことがしばしばあった。

そんな折、DWG TrueView なる無償ビューアを見つけた。これなら問題なく開けそうだ。

参考:http://pc-cals.nishida-tf.com/?eid=397111

2007-12-14 Fri

pythonのサンプルコード集 [python]

pythonスクリプトを使ってやりたい事は大体世界共通なので、他人様のコードが使えると大変に便利。
というわけでサンプルコード集についてメモ。

-ASPN: Python
-Useless Python
-Pythonというプログラミング言語の逆引き(やりたい事から方法を調べる)が出来るwebサイトか本はありますか?日本語では難しいと思うので英語のサイトでも構いません。 質よ.. - 人力検索はてな

HTMLからアンカー(リンク)を抽出する [python][正規表現]

あるWeb pageを開いたら、リンクが一杯張られていて、リンク先全てをダウンロードしたい、という状況がある。
そのためには<a href>のリンクアンカーの中身を正規表現を使って拾い上げ、それらをwgetに喰わせるのが一般的な作戦である(と思う)。
pythonでこれを行ったのでメモ。下記は、pdfへのリンクのみを抽出している。

import re

fname = "hoge.html"
f = open(fname, 'r')
str = f.read()

regexp = r'<a href="(\S+?\.pdf)">(.+?)</a>'
reg = re.compile(regexp)

pos = 0
while True:
    r = reg.search(str, pos)
    if not r:
        break
    print 'wget %s' % r.group(1)
#    print 'name: %s' % r.group(2)
    pos = r.end()

もっと洗練された方法があるかもしれないが、動いたのでまあいいや。

Referrer (Inside): [2007-12-21-1]

2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12

最終更新時間: 2010-03-08 22:21