Skip to content

Trích dẫn (hậu Xuất bản)

Tháng Mười 7, 2014

Như đã viết ở bài trên (Xuất bản), nhà toán học là khổ nhất quả đất, lao tâm khổ tứ viết ra được bài báo, thì 2,3 năm sau cái công trình mang nặng đẻ đau ấy nó mới được chào đời.

Nhưng đẻ xong mới khổ, vì  báo in ra rồi, thì nó phải được đọc, được dùng nữa, thì mới có chút giá trị.  3 năm dài đấy, mà chẳng phải cu nào cũng thành thánh Gióng, đôi khi thành cu Sứt xóm dưới chẳng xong.

Để định chuẩn, mỗi ngành một cách. Theo cụ thân sinh ra mình kể lại, ở  một đại hội gần đây của Hội nhà Văn, đã có người đề nghị phương pháp cân. Còn trong toán và các môn khoa học nói chung, các bạn dùng các loại index (chỉ số), để tính mức độ trích dẫn của một tác giả. Có hai loại chỉ số chính: N-index và h-index.

N-index (của anh Sứt)  là tổng số các bài báo đã trích dẫn các công trình của anh ấy. Chẳng hạn anh có 10 bài, với số trích dẫn từng bài là 4,8,5,7,2,3,1,11, 6, 5 thì N là tổng các số trên, tức 52; h-index thì phức tạp hơn tý, nó là số tự nhiên x lớn nhất sao cho anh Sứt có x bài báo được trích dẫn ít nhất x lần. Chẳng hạn trong trường hợp trên h=5.

Qui tắc chung thì là N và h càng cao càng tốt. Các committee tuyển giáo sư mới thường dùng các index này  làm một (trong nhiều thước đo) để đánh giá chất lượng ứng cử viên.  Thật ra  không hẳn là N =300 thì tốt hơn N=150, hay h=15 thì tôt hơn h=12 , nhưng N bằng 7 hoặc h bằng 2 thì rất đáng để nghi ngờ.

Trong hai chỉ số trên, N luôn tăng nếu bạn viết thêm bài, nhưng h thì không chắc. Để chỉ số  h tăng được 1 đơn vị là cả một vấn đề, nhất là khi nó đã khá cao. Các nhà nghiên cứu được giải Nobel thường có chỉ số  h ở quãng 40.

Ở đây tôi không muốn đi vào thảo luận xem thế nào là chỉ số cao, thế nào là thấp (cái này phụ thuộc vào ngành cụ thể), và chỉ số nào quan trọng hơn. Vấn đề thú vị ở đây là: Quan hệ toán học giữa hai chỉ số này như thế nào ? 

Chẳng hạn nếu bạn biết chỉ số N của cu Sứt (ký hiệu là N(sứt)), liệu bạn có thể nói gì về h(sứt) ?

Hiển nhiên ta thấy là N \ge h. Nghĩ thêm một tẹo tèo teo nữa thì N \ge h^2.  Và thế là hết, ít nhât là từ định nghĩa khó có thể suy ra gì thêm nữa.

Nhưng cuộc sống bao giờ cũng thú vị hơn nếu bạn nhìn nó dưới con mắt xác suất thống kê.  Dưới ánh sáng của, hừm, xác suất thống kê, ta thử mô hình hoá cái chỉ số N.  Khi nói tới hai chỉ số trên, có một đại lượng  ta đã lờ tịt đi, là tổng số các bài báo mà anh Sứt đã viết. Giả sử anh đã viết m bài, với số trích dẫn là  n(1),…n(m). Hiển nhiên N là tổng của các số này

N= n(1) +…+ n(m)

và chỉ số h cũng tính được từ dãy số này.

Cái dãy n(1),…,n(m)  trong toán học có tên. Nó được gọi là một cách chia của N. Một cách chia của N là một cách viết N thành tổng của các số nguyên dương. Ví dụ $ N=5 có 7 cách chia  5; 1+4; 2+3; 1+2+2, 1+1+3, 1+1+1+2, 1+1+1+1+1. Có nhiều nhà toán học, bắt đầu từ Ramanujan,  nghiên cứu về các tính chất của cách chia.

Nếu ta nghĩ dãy n(1), …n(m)  là một cách chia ngẫu nhiên (chọn một cách ngẫu nhiên từ tập hợp tất cả các cách chia của N) thì chỉ số h  khi đó sẽ trở thành một biến ngẫu nhiên. Kỳ vọng của biến này có thể tính được cụ thể  .54 \sqrt N. Ngoải ra cũng có thể chứng minh được là phương sai của biến tương đối nhỏ, từ đó ta suy ra với xác suất cao, h  gần với .54 \sqrt N.

Mô hình này khá đúng với thực tế, it nhất trong toán học. Trong một bài gần đây trên Notices òf the American Math. Society, bạn Alex Young giảng giải phương pháp trên, và minh hoạ nó bằng số liêu từ một số nhà toán học nổi tiếng.  Sai số khi dùng kỳ vọng ở mô hình trên thường  chỉ ở quãng 1,2 đơn vị.  Điểm mấu chốt ở đây là bạn có thể đoán khá chính xác chỉ số h của anh Sứt  từ chỉ số N của anh ta, và trong phán đoán này, số bài báo của anh Sứt không có vai trò gì đáng kể. 

Không biết  mô hình này có áp dụng được  trong các ngành khác ?

From → Khác

4 phản hồi
  1. Văn à, chứng minh công thức h ~ 0.54 N có ở đâu?

  2. Dũng permalink

    Những bài viết của bác về thống kê và xác xuất ở dạng bình dân đều rất bổ ích.

Trackbacks & Pingbacks

  1. Làm dự án | Vuhavan's Blog
  2. First blog post | Nguyen Huynh Huy's blog

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: