Блог пользователя nagitaosu

Автор nagitaosu, история, 5 лет назад, По-английски

Since I couldn't find the latest rating distribution of Codeforces, I created it.
This plot only includes active users who has participated contests more than 5 times.

Past rating distribution

UPD: The plot is updated (2020/04/01)
UPD: Thanks to win, this plot has been updated again! (2021/07/09)

  • Проголосовать: нравится
  • +134
  • Проголосовать: не нравится

»
5 лет назад, # |
Rev. 2   Проголосовать: нравится 0 Проголосовать: не нравится

So according to the graph, there're more experts than specialists ? Interesting!

  • »
    »
    5 лет назад, # ^ |
      Проголосовать: нравится +32 Проголосовать: не нравится

    Expert is a 300 point band, whereas specialist is a 200 point band, so it's not that interesting :)

    • »
      »
      »
      5 лет назад, # ^ |
        Проголосовать: нравится +21 Проголосовать: не нравится

      What is interesting, though — is the odd jump at start of each band. I wonder why that happens

      • »
        »
        »
        »
        5 лет назад, # ^ |
          Проголосовать: нравится +75 Проголосовать: не нравится

        some people are reluctant to join contests if they think their rank will fall / they'll lose colour. So they sit at the lowest rating with their colour for a long time.

        • »
          »
          »
          »
          »
          5 лет назад, # ^ |
            Проголосовать: нравится +11 Проголосовать: не нравится

          It would be even more distorted if you count inactive users

»
5 лет назад, # |
  Проголосовать: нравится +1 Проголосовать: не нравится

Interesting. There are so many grandmasters. So I still got a long way to go

»
5 лет назад, # |
  Проголосовать: нравится 0 Проголосовать: не нравится

Almost Binomial Distribution.Interesting!

  • »
    »
    5 лет назад, # ^ |
    Rev. 2   Проголосовать: нравится 0 Проголосовать: не нравится

    Actually It's not that interesting, binomial distribution is expected to happen in most distributions related to ratings.

»
5 лет назад, # |
  Проголосовать: нравится +8 Проголосовать: не нравится

What is the median rating?

  • »
    »
    5 лет назад, # ^ |
    Rev. 2   Проголосовать: нравится +2 Проголосовать: не нравится

    Here are the statistical features.

    count    77654.000000
    mean      1405.483233
    std        282.043970
    min        -43.000000
    25%       1247.000000
    50%       1371.000000 # median
    75%       1509.000000
    max       3681.000000
    
    • »
      »
      »
      5 лет назад, # ^ |
        Проголосовать: нравится 0 Проголосовать: не нравится

      I think your data is fake. Rating 1509 can be in the top 25%? I can't believe it!

      • »
        »
        »
        »
        5 лет назад, # ^ |
          Проголосовать: нравится +8 Проголосовать: не нравится

        It may be correct, don't forget that in your first contest you rate starts from 1500 + There are people who make fake accounts and join like 1-2 contests and the leave it at like 1450-1600 rate

      • »
        »
        »
        »
        5 лет назад, # ^ |
          Проголосовать: нравится +13 Проголосовать: не нравится

        It is the features for all active users. If you pick up who has been participated contests more than 5 times, it will be look like this.

        count    42762.000000
        mean      1436.048407
        std        356.742685
        min        -43.000000
        25%       1181.000000
        50%       1393.000000 # median
        75%       1645.000000
        max       3681.000000
        
»
5 лет назад, # |
  Проголосовать: нравится +5 Проголосовать: не нравится

Interestingly, the first bar of any color is always taller than the last bar of previous color. It points to the fact that many people stop participating in rated contests once they achieve a particular color, isn't it? Facts from stats!

»
5 лет назад, # |
  Проголосовать: нравится +8 Проголосовать: не нравится

How did you create the rating distribution? Can you please share the code.

»
3 года назад, # |
  Проголосовать: нравится +42 Проголосовать: не нравится

I have updated the plot. It has some significant changes

  • »
    »
    3 года назад, # ^ |
      Проголосовать: нравится 0 Проголосовать: не нравится

    This shows quantity has increased a lot, quality is still in queue.

    • »
      »
      »
      3 года назад, # ^ |
        Проголосовать: нравится +9 Проголосовать: не нравится

      I think that this is largely the effect of https://codeforces.me/blog/entry/77890

      In the past, beginners started with a high initial rating. Then participating in contests naturally resulted in their rating going down into the grey zone. So people were motivated to abandon their old grey accounts and start new ones (with a high initial rating again). With this kind of behaviour, many people with actual low skills were not registered in the chart. Because of having too few contests. Or because of having their rating score somewhat higher than they deserve (thanks to multiple account re-rolling attempts and a bit of luck).

  • »
    »
    3 года назад, # ^ |
      Проголосовать: нравится +9 Проголосовать: не нравится

    I have updated the plot. It has some significant changes

    Could you please redo it with the number of participations >= 6? Beginners with only 5 contests don't have their rating fully converged and are missing the last 50 points: https://codeforces.me/blog/entry/77890

  • »
    »
    3 года назад, # ^ |
      Проголосовать: нравится 0 Проголосовать: не нравится

    no. of contestants at the first bar of the next level is greater than last bar of the current level

»
3 года назад, # |
  Проголосовать: нравится -16 Проголосовать: не нравится

Similarity with the Boltzmann distribution law.

  1. Where speed = performance
  2. molecules = contestants

Data fit with the law