LCOV - code coverage report
Current view: top level - gcc - ipa-profile.c (source / functions) Hit Total Coverage
Test: gcc.info Lines: 461 495 93.1 %
Date: 2020-04-04 11:58:09 Functions: 20 20 100.0 %
Legend: Lines: hit not hit | Branches: + taken - not taken # not executed Branches: 0 0 -

           Branch data     Line data    Source code
       1                 :            : /* Basic IPA optimizations based on profile.
       2                 :            :    Copyright (C) 2003-2020 Free Software Foundation, Inc.
       3                 :            : 
       4                 :            : This file is part of GCC.
       5                 :            : 
       6                 :            : GCC is free software; you can redistribute it and/or modify it under
       7                 :            : the terms of the GNU General Public License as published by the Free
       8                 :            : Software Foundation; either version 3, or (at your option) any later
       9                 :            : version.
      10                 :            : 
      11                 :            : GCC is distributed in the hope that it will be useful, but WITHOUT ANY
      12                 :            : WARRANTY; without even the implied warranty of MERCHANTABILITY or
      13                 :            : FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
      14                 :            : for more details.
      15                 :            : 
      16                 :            : You should have received a copy of the GNU General Public License
      17                 :            : along with GCC; see the file COPYING3.  If not see
      18                 :            : <http://www.gnu.org/licenses/>.  */
      19                 :            : 
      20                 :            : /* ipa-profile pass implements the following analysis propagating profille
      21                 :            :    inter-procedurally.
      22                 :            : 
      23                 :            :    - Count histogram construction.  This is a histogram analyzing how much
      24                 :            :      time is spent executing statements with a given execution count read
      25                 :            :      from profile feedback. This histogram is complete only with LTO,
      26                 :            :      otherwise it contains information only about the current unit.
      27                 :            : 
      28                 :            :      The information is used to set hot/cold thresholds.
      29                 :            :    - Next speculative indirect call resolution is performed:  the local
      30                 :            :      profile pass assigns profile-id to each function and provide us with a
      31                 :            :      histogram specifying the most common target.  We look up the callgraph
      32                 :            :      node corresponding to the target and produce a speculative call.
      33                 :            : 
      34                 :            :      This call may or may not survive through IPA optimization based on decision
      35                 :            :      of inliner. 
      36                 :            :    - Finally we propagate the following flags: unlikely executed, executed
      37                 :            :      once, executed at startup and executed at exit.  These flags are used to
      38                 :            :      control code size/performance threshold and code placement (by producing
      39                 :            :      .text.unlikely/.text.hot/.text.startup/.text.exit subsections).  */
      40                 :            : #include "config.h"
      41                 :            : #include "system.h"
      42                 :            : #include "coretypes.h"
      43                 :            : #include "backend.h"
      44                 :            : #include "tree.h"
      45                 :            : #include "gimple.h"
      46                 :            : #include "predict.h"
      47                 :            : #include "alloc-pool.h"
      48                 :            : #include "tree-pass.h"
      49                 :            : #include "cgraph.h"
      50                 :            : #include "data-streamer.h"
      51                 :            : #include "gimple-iterator.h"
      52                 :            : #include "ipa-utils.h"
      53                 :            : #include "profile.h"
      54                 :            : #include "value-prof.h"
      55                 :            : #include "tree-inline.h"
      56                 :            : #include "symbol-summary.h"
      57                 :            : #include "tree-vrp.h"
      58                 :            : #include "ipa-prop.h"
      59                 :            : #include "ipa-fnsummary.h"
      60                 :            : 
      61                 :            : /* Entry in the histogram.  */
      62                 :            : 
      63                 :            : struct histogram_entry
      64                 :            : {
      65                 :            :   gcov_type count;
      66                 :            :   int time;
      67                 :            :   int size;
      68                 :            : };
      69                 :            : 
      70                 :            : /* Histogram of profile values.
      71                 :            :    The histogram is represented as an ordered vector of entries allocated via
      72                 :            :    histogram_pool. During construction a separate hashtable is kept to lookup
      73                 :            :    duplicate entries.  */
      74                 :            : 
      75                 :            : vec<histogram_entry *> histogram;
      76                 :            : static object_allocator<histogram_entry> histogram_pool ("IPA histogram");
      77                 :            : 
      78                 :            : /* Hashtable support for storing SSA names hashed by their SSA_NAME_VAR.  */
      79                 :            : 
      80                 :            : struct histogram_hash : nofree_ptr_hash <histogram_entry>
      81                 :            : {
      82                 :            :   static inline hashval_t hash (const histogram_entry *);
      83                 :            :   static inline int equal (const histogram_entry *, const histogram_entry *);
      84                 :            : };
      85                 :            : 
      86                 :            : inline hashval_t
      87                 :      40738 : histogram_hash::hash (const histogram_entry *val)
      88                 :            : {
      89                 :      40738 :   return val->count;
      90                 :            : }
      91                 :            : 
      92                 :            : inline int
      93                 :      21410 : histogram_hash::equal (const histogram_entry *val, const histogram_entry *val2)
      94                 :            : {
      95                 :      21410 :   return val->count == val2->count;
      96                 :            : }
      97                 :            : 
      98                 :            : /* Account TIME and SIZE executed COUNT times into HISTOGRAM.
      99                 :            :    HASHTABLE is the on-side hash kept to avoid duplicates.  */
     100                 :            : 
     101                 :            : static void
     102                 :      19470 : account_time_size (hash_table<histogram_hash> *hashtable,
     103                 :            :                    vec<histogram_entry *> &histogram,
     104                 :            :                    gcov_type count, int time, int size)
     105                 :            : {
     106                 :      19470 :   histogram_entry key = {count, 0, 0};
     107                 :      19470 :   histogram_entry **val = hashtable->find_slot (&key, INSERT);
     108                 :            : 
     109                 :      19470 :   if (!*val)
     110                 :            :     {
     111                 :       2586 :       *val = histogram_pool.allocate ();
     112                 :       2586 :       **val = key;
     113                 :       2586 :       histogram.safe_push (*val);
     114                 :            :     }
     115                 :      19470 :   (*val)->time += time;
     116                 :      19470 :   (*val)->size += size;
     117                 :      19470 : }
     118                 :            : 
     119                 :            : int
     120                 :       4214 : cmp_counts (const void *v1, const void *v2)
     121                 :            : {
     122                 :       4214 :   const histogram_entry *h1 = *(const histogram_entry * const *)v1;
     123                 :       4214 :   const histogram_entry *h2 = *(const histogram_entry * const *)v2;
     124                 :       4214 :   if (h1->count < h2->count)
     125                 :            :     return 1;
     126                 :       2409 :   if (h1->count > h2->count)
     127                 :       2409 :     return -1;
     128                 :            :   return 0;
     129                 :            : }
     130                 :            : 
     131                 :            : /* Dump HISTOGRAM to FILE.  */
     132                 :            : 
     133                 :            : static void
     134                 :         28 : dump_histogram (FILE *file, vec<histogram_entry *> histogram)
     135                 :            : {
     136                 :         28 :   unsigned int i;
     137                 :         28 :   gcov_type overall_time = 0, cumulated_time = 0, cumulated_size = 0,
     138                 :         28 :             overall_size = 0;
     139                 :            :   
     140                 :         28 :   fprintf (dump_file, "Histogram:\n");
     141                 :         70 :   for (i = 0; i < histogram.length (); i++)
     142                 :            :     {
     143                 :         19 :       overall_time += histogram[i]->count * histogram[i]->time;
     144                 :         19 :       overall_size += histogram[i]->size;
     145                 :            :     }
     146                 :         28 :   if (!overall_time)
     147                 :         24 :     overall_time = 1;
     148                 :         28 :   if (!overall_size)
     149                 :         24 :     overall_size = 1;
     150                 :         70 :   for (i = 0; i < histogram.length (); i++)
     151                 :            :     {
     152                 :         19 :       cumulated_time += histogram[i]->count * histogram[i]->time;
     153                 :         19 :       cumulated_size += histogram[i]->size;
     154                 :         19 :       fprintf (file, "  %" PRId64": time:%i (%2.2f) size:%i (%2.2f)\n",
     155                 :         19 :                (int64_t) histogram[i]->count,
     156                 :         19 :                histogram[i]->time,
     157                 :         19 :                cumulated_time * 100.0 / overall_time,
     158                 :         19 :                histogram[i]->size,
     159                 :         19 :                cumulated_size * 100.0 / overall_size);
     160                 :            :    }
     161                 :         28 : }
     162                 :            : 
     163                 :            : /* Structure containing speculative target information from profile.  */
     164                 :            : 
     165                 :            : struct speculative_call_target
     166                 :            : {
     167                 :         80 :   speculative_call_target (unsigned int id = 0, int prob = 0)
     168                 :         38 :     : target_id (id), target_probability (prob)
     169                 :            :   {
     170                 :            :   }
     171                 :            : 
     172                 :            :   /* Profile_id of target obtained from profile.  */
     173                 :            :   unsigned int target_id;
     174                 :            :   /* Probability that call will land in function with target_id.  */
     175                 :            :   unsigned int target_probability;
     176                 :            : };
     177                 :            : 
     178                 :     116733 : class speculative_call_summary
     179                 :            : {
     180                 :            : public:
     181                 :     117464 :   speculative_call_summary () : speculative_call_targets ()
     182                 :            :   {}
     183                 :            : 
     184                 :            :   auto_vec<speculative_call_target> speculative_call_targets;
     185                 :            : 
     186                 :            :   void dump (FILE *f);
     187                 :            : 
     188                 :            : };
     189                 :            : 
     190                 :            :   /* Class to manage call summaries.  */
     191                 :            : 
     192                 :            : class ipa_profile_call_summaries
     193                 :            :   : public call_summary<speculative_call_summary *>
     194                 :            : {
     195                 :            : public:
     196                 :     118296 :   ipa_profile_call_summaries (symbol_table *table)
     197                 :     236592 :     : call_summary<speculative_call_summary *> (table)
     198                 :            :   {}
     199                 :            : 
     200                 :            :   /* Duplicate info when an edge is cloned.  */
     201                 :            :   virtual void duplicate (cgraph_edge *, cgraph_edge *,
     202                 :            :                           speculative_call_summary *old_sum,
     203                 :            :                           speculative_call_summary *new_sum);
     204                 :            : };
     205                 :            : 
     206                 :            : static ipa_profile_call_summaries *call_sums = NULL;
     207                 :            : 
     208                 :            : /* Dump all information in speculative call summary to F.  */
     209                 :            : 
     210                 :            : void
     211                 :         38 : speculative_call_summary::dump (FILE *f)
     212                 :            : {
     213                 :         38 :   cgraph_node *n2;
     214                 :            : 
     215                 :         38 :   unsigned spec_count = speculative_call_targets.length ();
     216                 :         45 :   for (unsigned i = 0; i < spec_count; i++)
     217                 :            :     {
     218                 :          7 :       speculative_call_target item = speculative_call_targets[i];
     219                 :          7 :       n2 = find_func_by_profile_id (item.target_id);
     220                 :          7 :       if (n2)
     221                 :          7 :         fprintf (f, "    The %i speculative target is %s with prob %3.2f\n", i,
     222                 :            :                  n2->dump_name (),
     223                 :          7 :                  item.target_probability / (float) REG_BR_PROB_BASE);
     224                 :            :       else
     225                 :          0 :         fprintf (f, "    The %i speculative target is %u with prob %3.2f\n", i,
     226                 :            :                  item.target_id,
     227                 :          0 :                  item.target_probability / (float) REG_BR_PROB_BASE);
     228                 :            :     }
     229                 :         38 : }
     230                 :            : 
     231                 :            : /* Duplicate info when an edge is cloned.  */
     232                 :            : 
     233                 :            : void
     234                 :         30 : ipa_profile_call_summaries::duplicate (cgraph_edge *, cgraph_edge *,
     235                 :            :                                        speculative_call_summary *old_sum,
     236                 :            :                                        speculative_call_summary *new_sum)
     237                 :            : {
     238                 :         30 :   if (!old_sum)
     239                 :            :     return;
     240                 :            : 
     241                 :         30 :   unsigned old_count = old_sum->speculative_call_targets.length ();
     242                 :         30 :   if (!old_count)
     243                 :            :     return;
     244                 :            : 
     245                 :         30 :   new_sum->speculative_call_targets.reserve_exact (old_count);
     246                 :         30 :   new_sum->speculative_call_targets.quick_grow_cleared (old_count);
     247                 :            : 
     248                 :         68 :   for (unsigned i = 0; i < old_count; i++)
     249                 :            :     {
     250                 :        114 :       new_sum->speculative_call_targets[i]
     251                 :         38 :         = old_sum->speculative_call_targets[i];
     252                 :            :     }
     253                 :            : }
     254                 :            : 
     255                 :            : /* Collect histogram and speculative target summaries from CFG profiles.  */
     256                 :            : 
     257                 :            : static void
     258                 :     109665 : ipa_profile_generate_summary (void)
     259                 :            : {
     260                 :     109665 :   struct cgraph_node *node;
     261                 :     109665 :   gimple_stmt_iterator gsi;
     262                 :     109665 :   basic_block bb;
     263                 :            : 
     264                 :     109665 :   hash_table<histogram_hash> hashtable (10);
     265                 :            : 
     266                 :     109665 :   gcc_checking_assert (!call_sums);
     267                 :     109665 :   call_sums = new ipa_profile_call_summaries (symtab);
     268                 :            : 
     269                 :    1074920 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
     270                 :     855591 :     if (ENTRY_BLOCK_PTR_FOR_FN
     271                 :    1711180 :           (DECL_STRUCT_FUNCTION (node->decl))->count.ipa_p ())
     272                 :      25209 :       FOR_EACH_BB_FN (bb, DECL_STRUCT_FUNCTION (node->decl))
     273                 :            :         {
     274                 :      21320 :           int time = 0;
     275                 :      21320 :           int size = 0;
     276                 :     141972 :           for (gsi = gsi_start_bb (bb); !gsi_end_p (gsi); gsi_next (&gsi))
     277                 :            :             {
     278                 :      99332 :               gimple *stmt = gsi_stmt (gsi);
     279                 :      99332 :               if (gimple_code (stmt) == GIMPLE_CALL
     280                 :      99332 :                   && !gimple_call_fndecl (stmt))
     281                 :            :                 {
     282                 :        113 :                   histogram_value h;
     283                 :        113 :                   h = gimple_histogram_value_of_type
     284                 :        113 :                         (DECL_STRUCT_FUNCTION (node->decl),
     285                 :            :                          stmt, HIST_TYPE_INDIR_CALL);
     286                 :            :                   /* No need to do sanity check: gimple_ic_transform already
     287                 :            :                      takes away bad histograms.  */
     288                 :        113 :                   if (h)
     289                 :            :                     {
     290                 :         34 :                       gcov_type val, count, all;
     291                 :         34 :                       struct cgraph_edge *e = node->get_edge (stmt);
     292                 :         34 :                       if (e && !e->indirect_unknown_callee)
     293                 :          0 :                         continue;
     294                 :            : 
     295                 :         34 :                       speculative_call_summary *csum
     296                 :         34 :                         = call_sums->get_create (e);
     297                 :            : 
     298                 :        170 :                       for (unsigned j = 0; j < GCOV_TOPN_VALUES; j++)
     299                 :            :                         {
     300                 :        136 :                           if (!get_nth_most_common_value (NULL, "indirect call",
     301                 :            :                                                           h, &val, &count, &all,
     302                 :            :                                                           j))
     303                 :         99 :                             continue;
     304                 :            : 
     305                 :        136 :                           if (val == 0 || count == 0)
     306                 :         99 :                             continue;
     307                 :            : 
     308                 :         37 :                           if (count > all)
     309                 :            :                             {
     310                 :          0 :                               if (dump_file)
     311                 :          0 :                                 fprintf (dump_file,
     312                 :            :                                          "Probability capped to 1\n");
     313                 :          0 :                               count = all;
     314                 :            :                             }
     315                 :         37 :                           speculative_call_target item (
     316                 :         37 :                             val, GCOV_COMPUTE_SCALE (count, all));
     317                 :         37 :                           csum->speculative_call_targets.safe_push (item);
     318                 :            :                         }
     319                 :            : 
     320                 :         34 :                       gimple_remove_histogram_value
     321                 :         34 :                          (DECL_STRUCT_FUNCTION (node->decl), stmt, h);
     322                 :            :                     }
     323                 :            :                 }
     324                 :      99332 :               time += estimate_num_insns (stmt, &eni_time_weights);
     325                 :      99332 :               size += estimate_num_insns (stmt, &eni_size_weights);
     326                 :            :             }
     327                 :      59854 :           if (bb->count.ipa_p () && bb->count.initialized_p ())
     328                 :      19267 :             account_time_size (&hashtable, histogram,
     329                 :      38534 :                                bb->count.ipa ().to_gcov_type (),
     330                 :            :                                time, size);
     331                 :            :         }
     332                 :     111691 :   histogram.qsort (cmp_counts);
     333                 :     109665 : }
     334                 :            : 
     335                 :            : /* Serialize the speculative summary info for LTO.  */
     336                 :            : 
     337                 :            : static void
     338                 :       1502 : ipa_profile_write_edge_summary (lto_simple_output_block *ob,
     339                 :            :                                 speculative_call_summary *csum)
     340                 :            : {
     341                 :       1502 :   unsigned len = 0;
     342                 :            : 
     343                 :       1502 :   len = csum->speculative_call_targets.length ();
     344                 :            : 
     345                 :          3 :   gcc_assert (len <= GCOV_TOPN_VALUES);
     346                 :            : 
     347                 :       1502 :   streamer_write_hwi_stream (ob->main_stream, len);
     348                 :            : 
     349                 :       1502 :   if (len)
     350                 :            :     {
     351                 :          3 :       unsigned spec_count = csum->speculative_call_targets.length ();
     352                 :          8 :       for (unsigned i = 0; i < spec_count; i++)
     353                 :            :         {
     354                 :          5 :           speculative_call_target item = csum->speculative_call_targets[i];
     355                 :          5 :           gcc_assert (item.target_id);
     356                 :          5 :           streamer_write_hwi_stream (ob->main_stream, item.target_id);
     357                 :          5 :           streamer_write_hwi_stream (ob->main_stream, item.target_probability);
     358                 :            :         }
     359                 :            :     }
     360                 :       1502 : }
     361                 :            : 
     362                 :            : /* Serialize the ipa info for lto.  */
     363                 :            : 
     364                 :            : static void
     365                 :      15301 : ipa_profile_write_summary (void)
     366                 :            : {
     367                 :      15301 :   struct lto_simple_output_block *ob
     368                 :      15301 :     = lto_create_simple_output_block (LTO_section_ipa_profile);
     369                 :      15301 :   unsigned int i;
     370                 :            : 
     371                 :      15301 :   streamer_write_uhwi_stream (ob->main_stream, histogram.length ());
     372                 :      16367 :   for (i = 0; i < histogram.length (); i++)
     373                 :            :     {
     374                 :        360 :       streamer_write_gcov_count_stream (ob->main_stream, histogram[i]->count);
     375                 :        360 :       streamer_write_uhwi_stream (ob->main_stream, histogram[i]->time);
     376                 :        360 :       streamer_write_uhwi_stream (ob->main_stream, histogram[i]->size);
     377                 :            :     }
     378                 :            : 
     379                 :      15301 :   if (!call_sums)
     380                 :          0 :     return;
     381                 :            : 
     382                 :            :   /* Serialize speculative targets information.  */
     383                 :      15301 :   unsigned int count = 0;
     384                 :      15301 :   lto_symtab_encoder_t encoder = ob->decl_state->symtab_node_encoder;
     385                 :      15301 :   lto_symtab_encoder_iterator lsei;
     386                 :      15301 :   cgraph_node *node;
     387                 :            : 
     388                 :     187506 :   for (lsei = lsei_start_function_in_partition (encoder); !lsei_end_p (lsei);
     389                 :      78536 :        lsei_next_function_in_partition (&lsei))
     390                 :            :     {
     391                 :      78536 :       node = lsei_cgraph_node (lsei);
     392                 :      78536 :       if (node->definition && node->has_gimple_body_p ()
     393                 :     156101 :           && node->indirect_calls)
     394                 :        751 :         count++;
     395                 :            :     }
     396                 :            : 
     397                 :      15301 :   streamer_write_uhwi_stream (ob->main_stream, count);
     398                 :            : 
     399                 :            :   /* Process all of the functions.  */
     400                 :      18743 :   for (lsei = lsei_start_function_in_partition (encoder);
     401                 :      37318 :        !lsei_end_p (lsei) && count; lsei_next_function_in_partition (&lsei))
     402                 :            :     {
     403                 :       3442 :       cgraph_node *node = lsei_cgraph_node (lsei);
     404                 :       3442 :       if (node->definition && node->has_gimple_body_p ()
     405                 :       6528 :           && node->indirect_calls)
     406                 :            :         {
     407                 :        751 :           int node_ref = lto_symtab_encoder_encode (encoder, node);
     408                 :        751 :           streamer_write_uhwi_stream (ob->main_stream, node_ref);
     409                 :            : 
     410                 :       2253 :           for (cgraph_edge *e = node->indirect_calls; e; e = e->next_callee)
     411                 :            :             {
     412                 :       1502 :               speculative_call_summary *csum = call_sums->get_create (e);
     413                 :       1502 :               ipa_profile_write_edge_summary (ob, csum);
     414                 :            :             }
     415                 :            :       }
     416                 :            :     }
     417                 :            : 
     418                 :      15301 :   lto_destroy_simple_output_block (ob);
     419                 :            : }
     420                 :            : 
     421                 :            : /* Dump all profile summary data for all cgraph nodes and edges to file F.  */
     422                 :            : 
     423                 :            : static void
     424                 :         28 : ipa_profile_dump_all_summaries (FILE *f)
     425                 :            : {
     426                 :         28 :   fprintf (dump_file,
     427                 :            :            "\n========== IPA-profile speculative targets: ==========\n");
     428                 :         28 :   cgraph_node *node;
     429                 :        200 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
     430                 :            :     {
     431                 :         72 :       fprintf (f, "\nSummary for node %s:\n", node->dump_name ());
     432                 :        110 :       for (cgraph_edge *e = node->indirect_calls; e; e = e->next_callee)
     433                 :            :         {
     434                 :         38 :           fprintf (f, "  Summary for %s of indirect edge %d:\n",
     435                 :         38 :                    e->caller->dump_name (), e->lto_stmt_uid);
     436                 :         38 :           speculative_call_summary *csum = call_sums->get_create (e);
     437                 :         38 :           csum->dump (f);
     438                 :            :         }
     439                 :            :     }
     440                 :         28 :   fprintf (f, "\n\n");
     441                 :         28 : }
     442                 :            : 
     443                 :            : /* Read speculative targets information about edge for LTO WPA.  */
     444                 :            : 
     445                 :            : static void
     446                 :       1060 : ipa_profile_read_edge_summary (class lto_input_block *ib, cgraph_edge *edge)
     447                 :            : {
     448                 :       1060 :   unsigned i, len;
     449                 :            : 
     450                 :       1060 :   len = streamer_read_hwi (ib);
     451                 :       1060 :   gcc_assert (len <= GCOV_TOPN_VALUES);
     452                 :            : 
     453                 :       1060 :   speculative_call_summary *csum = call_sums->get_create (edge);
     454                 :            : 
     455                 :       1065 :   for (i = 0; i < len; i++)
     456                 :            :   {
     457                 :          5 :     unsigned int target_id = streamer_read_hwi (ib);
     458                 :          5 :     int target_probability = streamer_read_hwi (ib);
     459                 :          5 :     speculative_call_target item (target_id, target_probability);
     460                 :          5 :     csum->speculative_call_targets.safe_push (item);
     461                 :            :   }
     462                 :       1060 : }
     463                 :            : 
     464                 :            : /* Read profile speculative targets section information for LTO WPA.  */
     465                 :            : 
     466                 :            : static void
     467                 :       8619 : ipa_profile_read_summary_section (struct lto_file_decl_data *file_data,
     468                 :            :                                   class lto_input_block *ib)
     469                 :            : {
     470                 :       8619 :   if (!ib)
     471                 :            :     return;
     472                 :            : 
     473                 :       8619 :   lto_symtab_encoder_t encoder = file_data->symtab_node_encoder;
     474                 :            : 
     475                 :       8619 :   unsigned int count = streamer_read_uhwi (ib);
     476                 :            : 
     477                 :       8619 :   unsigned int i;
     478                 :       8619 :   unsigned int index;
     479                 :       8619 :   cgraph_node * node;
     480                 :            : 
     481                 :       9041 :   for (i = 0; i < count; i++)
     482                 :            :     {
     483                 :        422 :       index = streamer_read_uhwi (ib);
     484                 :        422 :       encoder = file_data->symtab_node_encoder;
     485                 :        422 :       node
     486                 :        844 :         = dyn_cast<cgraph_node *> (lto_symtab_encoder_deref (encoder, index));
     487                 :            : 
     488                 :       1482 :       for (cgraph_edge *e = node->indirect_calls; e; e = e->next_callee)
     489                 :       1060 :         ipa_profile_read_edge_summary (ib, e);
     490                 :            :     }
     491                 :            : }
     492                 :            : 
     493                 :            : /* Deserialize the IPA histogram and speculative targets summary info for LTO.
     494                 :            :    */
     495                 :            : 
     496                 :            : static void
     497                 :       8631 : ipa_profile_read_summary (void)
     498                 :            : {
     499                 :       8631 :   struct lto_file_decl_data ** file_data_vec
     500                 :       8631 :     = lto_get_file_decl_data ();
     501                 :       8631 :   struct lto_file_decl_data * file_data;
     502                 :       8631 :   int j = 0;
     503                 :            : 
     504                 :       8631 :   hash_table<histogram_hash> hashtable (10);
     505                 :            : 
     506                 :       8631 :   gcc_checking_assert (!call_sums);
     507                 :       8631 :   call_sums = new ipa_profile_call_summaries (symtab);
     508                 :            : 
     509                 :      18199 :   while ((file_data = file_data_vec[j++]))
     510                 :            :     {
     511                 :       9568 :       const char *data;
     512                 :       9568 :       size_t len;
     513                 :       9568 :       class lto_input_block *ib
     514                 :       9568 :         = lto_create_simple_input_block (file_data,
     515                 :            :                                          LTO_section_ipa_profile,
     516                 :            :                                          &data, &len);
     517                 :       9568 :       if (ib)
     518                 :            :         {
     519                 :       8619 :           unsigned int num = streamer_read_uhwi (ib);
     520                 :       8619 :           unsigned int n;
     521                 :       8822 :           for (n = 0; n < num; n++)
     522                 :            :             {
     523                 :        203 :               gcov_type count = streamer_read_gcov_count (ib);
     524                 :        203 :               int time = streamer_read_uhwi (ib);
     525                 :        203 :               int size = streamer_read_uhwi (ib);
     526                 :        203 :               account_time_size (&hashtable, histogram,
     527                 :            :                                  count, time, size);
     528                 :            :             }
     529                 :            : 
     530                 :       8619 :           ipa_profile_read_summary_section (file_data, ib);
     531                 :            : 
     532                 :       8619 :           lto_destroy_simple_input_block (file_data,
     533                 :            :                                           LTO_section_ipa_profile,
     534                 :            :                                           ib, data, len);
     535                 :            :         }
     536                 :            :     }
     537                 :       8816 :   histogram.qsort (cmp_counts);
     538                 :       8631 : }
     539                 :            : 
     540                 :            : /* Data used by ipa_propagate_frequency.  */
     541                 :            : 
     542                 :            : struct ipa_propagate_frequency_data
     543                 :            : {
     544                 :            :   cgraph_node *function_symbol;
     545                 :            :   bool maybe_unlikely_executed;
     546                 :            :   bool maybe_executed_once;
     547                 :            :   bool only_called_at_startup;
     548                 :            :   bool only_called_at_exit;
     549                 :            : };
     550                 :            : 
     551                 :            : /* Worker for ipa_propagate_frequency_1.  */
     552                 :            : 
     553                 :            : static bool
     554                 :    2554840 : ipa_propagate_frequency_1 (struct cgraph_node *node, void *data)
     555                 :            : {
     556                 :    2554840 :   struct ipa_propagate_frequency_data *d;
     557                 :    2554840 :   struct cgraph_edge *edge;
     558                 :            : 
     559                 :    2554840 :   d = (struct ipa_propagate_frequency_data *)data;
     560                 :    2554840 :   for (edge = node->callers;
     561                 :    5177290 :        edge && (d->maybe_unlikely_executed || d->maybe_executed_once
     562                 :      74843 :                 || d->only_called_at_startup || d->only_called_at_exit);
     563                 :    2622450 :        edge = edge->next_caller)
     564                 :            :     {
     565                 :    2622450 :       if (edge->caller != d->function_symbol)
     566                 :            :         {
     567                 :    2621170 :           d->only_called_at_startup &= edge->caller->only_called_at_startup;
     568                 :            :           /* It makes sense to put main() together with the static constructors.
     569                 :            :              It will be executed for sure, but rest of functions called from
     570                 :            :              main are definitely not at startup only.  */
     571                 :    2621170 :           if (MAIN_NAME_P (DECL_NAME (edge->caller->decl)))
     572                 :     110553 :             d->only_called_at_startup = 0;
     573                 :    2621170 :           d->only_called_at_exit &= edge->caller->only_called_at_exit;
     574                 :            :         }
     575                 :            : 
     576                 :            :       /* When profile feedback is available, do not try to propagate too hard;
     577                 :            :          counts are already good guide on function frequencies and roundoff
     578                 :            :          errors can make us to push function into unlikely section even when
     579                 :            :          it is executed by the train run.  Transfer the function only if all
     580                 :            :          callers are unlikely executed.  */
     581                 :    2622450 :       if (profile_info
     582                 :    2622900 :           && !(edge->callee->count.ipa () == profile_count::zero ())
     583                 :    2622900 :           && (edge->caller->frequency != NODE_FREQUENCY_UNLIKELY_EXECUTED
     584                 :          0 :               || (edge->caller->inlined_to
     585                 :          0 :                   && edge->caller->inlined_to->frequency
     586                 :          0 :                      != NODE_FREQUENCY_UNLIKELY_EXECUTED)))
     587                 :        451 :           d->maybe_unlikely_executed = false;
     588                 :    2622450 :       if (edge->count.ipa ().initialized_p ()
     589                 :    2622590 :           && !edge->count.ipa ().nonzero_p ())
     590                 :      18152 :         continue;
     591                 :    2604300 :       switch (edge->caller->frequency)
     592                 :            :         {
     593                 :            :         case NODE_FREQUENCY_UNLIKELY_EXECUTED:
     594                 :            :           break;
     595                 :     232065 :         case NODE_FREQUENCY_EXECUTED_ONCE:
     596                 :     232065 :           {
     597                 :     232065 :             if (dump_file && (dump_flags & TDF_DETAILS))
     598                 :        119 :               fprintf (dump_file, "  Called by %s that is executed once\n",
     599                 :            :                        edge->caller->dump_name ());
     600                 :     232065 :             d->maybe_unlikely_executed = false;
     601                 :     232065 :             ipa_call_summary *s = ipa_call_summaries->get (edge);
     602                 :     232065 :             if (s != NULL && s->loop_depth)
     603                 :            :               {
     604                 :       5590 :                 d->maybe_executed_once = false;
     605                 :       5590 :                 if (dump_file && (dump_flags & TDF_DETAILS))
     606                 :          4 :                   fprintf (dump_file, "  Called in loop\n");
     607                 :            :               }
     608                 :            :             break;
     609                 :            :           }
     610                 :    2372000 :         case NODE_FREQUENCY_HOT:
     611                 :    2372000 :         case NODE_FREQUENCY_NORMAL:
     612                 :    2372000 :           if (dump_file && (dump_flags & TDF_DETAILS))
     613                 :        111 :             fprintf (dump_file, "  Called by %s that is normal or hot\n",
     614                 :            :                      edge->caller->dump_name ());
     615                 :    2372000 :           d->maybe_unlikely_executed = false;
     616                 :    2372000 :           d->maybe_executed_once = false;
     617                 :    2372000 :           break;
     618                 :            :         }
     619                 :            :     }
     620                 :    2554840 :   return edge != NULL;
     621                 :            : }
     622                 :            : 
     623                 :            : /* Return ture if NODE contains hot calls.  */
     624                 :            : 
     625                 :            : bool
     626                 :      12779 : contains_hot_call_p (struct cgraph_node *node)
     627                 :            : {
     628                 :      12779 :   struct cgraph_edge *e;
     629                 :      33974 :   for (e = node->callees; e; e = e->next_callee)
     630                 :      21197 :     if (e->maybe_hot_p ())
     631                 :            :       return true;
     632                 :      21195 :     else if (!e->inline_failed
     633                 :      21195 :              && contains_hot_call_p (e->callee))
     634                 :            :       return true;
     635                 :      13250 :   for (e = node->indirect_calls; e; e = e->next_callee)
     636                 :        473 :     if (e->maybe_hot_p ())
     637                 :            :       return true;
     638                 :            :   return false;
     639                 :            : }
     640                 :            : 
     641                 :            : /* See if the frequency of NODE can be updated based on frequencies of its
     642                 :            :    callers.  */
     643                 :            : bool
     644                 :    4900520 : ipa_propagate_frequency (struct cgraph_node *node)
     645                 :            : {
     646                 :    4900520 :   struct ipa_propagate_frequency_data d = {node, true, true, true, true};
     647                 :    4900520 :   bool changed = false;
     648                 :            : 
     649                 :            :   /* We cannot propagate anything useful about externally visible functions
     650                 :            :      nor about virtuals.  */
     651                 :    4900520 :   if (!node->local
     652                 :    2589120 :       || node->alias
     653                 :    7483470 :       || (opt_for_fn (node->decl, flag_devirtualize)
     654                 :    2538040 :           && DECL_VIRTUAL_P (node->decl)))
     655                 :            :     return false;
     656                 :    2549030 :   gcc_assert (node->analyzed);
     657                 :    2549030 :   if (dump_file && (dump_flags & TDF_DETAILS))
     658                 :        230 :     fprintf (dump_file, "Processing frequency %s\n", node->dump_name ());
     659                 :            : 
     660                 :    2549030 :   node->call_for_symbol_and_aliases (ipa_propagate_frequency_1, &d,
     661                 :            :                                      true);
     662                 :            : 
     663                 :    2549030 :   if ((d.only_called_at_startup && !d.only_called_at_exit)
     664                 :      32877 :       && !node->only_called_at_startup)
     665                 :            :     {
     666                 :      13227 :        node->only_called_at_startup = true;
     667                 :      13227 :        if (dump_file)
     668                 :          1 :          fprintf (dump_file, "Node %s promoted to only called at startup.\n",
     669                 :            :                   node->dump_name ());
     670                 :            :        changed = true;
     671                 :            :     }
     672                 :    2549030 :   if ((d.only_called_at_exit && !d.only_called_at_startup)
     673                 :         16 :       && !node->only_called_at_exit)
     674                 :            :     {
     675                 :          8 :        node->only_called_at_exit = true;
     676                 :          8 :        if (dump_file)
     677                 :          0 :          fprintf (dump_file, "Node %s promoted to only called at exit.\n",
     678                 :            :                   node->dump_name ());
     679                 :            :        changed = true;
     680                 :            :     }
     681                 :            : 
     682                 :            :   /* With profile we can decide on hot/normal based on count.  */
     683                 :    2549030 :   if (node->count. ipa().initialized_p ())
     684                 :            :     {
     685                 :      10465 :       bool hot = false;
     686                 :      20793 :       if (!(node->count. ipa() == profile_count::zero ())
     687                 :        137 :           && node->count. ipa() >= get_hot_bb_threshold ())
     688                 :        132 :         hot = true;
     689                 :        132 :       if (!hot)
     690                 :      10333 :         hot |= contains_hot_call_p (node);
     691                 :      10465 :       if (hot)
     692                 :            :         {
     693                 :        134 :           if (node->frequency != NODE_FREQUENCY_HOT)
     694                 :            :             {
     695                 :          6 :               if (dump_file)
     696                 :          0 :                 fprintf (dump_file, "Node %s promoted to hot.\n",
     697                 :            :                          node->dump_name ());
     698                 :          6 :               node->frequency = NODE_FREQUENCY_HOT;
     699                 :          6 :               return true;
     700                 :            :             }
     701                 :            :           return false;
     702                 :            :         }
     703                 :      10331 :       else if (node->frequency == NODE_FREQUENCY_HOT)
     704                 :            :         {
     705                 :          2 :           if (dump_file)
     706                 :          0 :             fprintf (dump_file, "Node %s reduced to normal.\n",
     707                 :            :                      node->dump_name ());
     708                 :          2 :           node->frequency = NODE_FREQUENCY_NORMAL;
     709                 :          2 :           changed = true;
     710                 :            :         }
     711                 :            :     }
     712                 :            :   /* These come either from profile or user hints; never update them.  */
     713                 :    2548900 :   if (node->frequency == NODE_FREQUENCY_HOT
     714                 :    2548900 :       || node->frequency == NODE_FREQUENCY_UNLIKELY_EXECUTED)
     715                 :            :     return changed;
     716                 :    2540530 :   if (d.maybe_unlikely_executed)
     717                 :            :     {
     718                 :       3159 :       node->frequency = NODE_FREQUENCY_UNLIKELY_EXECUTED;
     719                 :       3159 :       if (dump_file)
     720                 :          0 :         fprintf (dump_file, "Node %s promoted to unlikely executed.\n",
     721                 :            :                  node->dump_name ());
     722                 :            :       changed = true;
     723                 :            :     }
     724                 :    2537380 :   else if (d.maybe_executed_once && node->frequency != NODE_FREQUENCY_EXECUTED_ONCE)
     725                 :            :     {
     726                 :      72184 :       node->frequency = NODE_FREQUENCY_EXECUTED_ONCE;
     727                 :      72184 :       if (dump_file)
     728                 :         84 :         fprintf (dump_file, "Node %s promoted to executed once.\n",
     729                 :            :                  node->dump_name ());
     730                 :            :       changed = true;
     731                 :            :     }
     732                 :            :   return changed;
     733                 :            : }
     734                 :            : 
     735                 :            : /* Check that number of arguments of N agrees with E.
     736                 :            :    Be conservative when summaries are not present.  */
     737                 :            : 
     738                 :            : static bool
     739                 :         30 : check_argument_count (struct cgraph_node *n, struct cgraph_edge *e)
     740                 :            : {
     741                 :         30 :   if (!ipa_node_params_sum || !ipa_edge_args_sum)
     742                 :            :     return true;
     743                 :         30 :   class ipa_node_params *info = IPA_NODE_REF (n->function_symbol ());
     744                 :         30 :   if (!info)
     745                 :          0 :     return true;
     746                 :         30 :   ipa_edge_args *e_info = IPA_EDGE_REF (e);
     747                 :         30 :   if (!e_info)
     748                 :          0 :     return true;
     749                 :         47 :   if (ipa_get_param_count (info) != ipa_get_cs_argument_count (e_info)
     750                 :         30 :       && (ipa_get_param_count (info) >= ipa_get_cs_argument_count (e_info)
     751                 :          0 :           || !stdarg_p (TREE_TYPE (n->decl))))
     752                 :          0 :     return false;
     753                 :            :   return true;
     754                 :            : }
     755                 :            : 
     756                 :            : /* Simple ipa profile pass propagating frequencies across the callgraph.  */
     757                 :            : 
     758                 :            : static unsigned int
     759                 :     110920 : ipa_profile (void)
     760                 :            : {
     761                 :     110920 :   struct cgraph_node **order;
     762                 :     110920 :   struct cgraph_edge *e;
     763                 :     110920 :   int order_pos;
     764                 :     110920 :   bool something_changed = false;
     765                 :     110920 :   int i;
     766                 :     110920 :   gcov_type overall_time = 0, cutoff = 0, cumulated = 0, overall_size = 0;
     767                 :     110920 :   struct cgraph_node *n,*n2;
     768                 :     110920 :   int nindirect = 0, ncommon = 0, nunknown = 0, nuseless = 0, nconverted = 0;
     769                 :     110920 :   int nmismatch = 0, nimpossible = 0;
     770                 :     110920 :   bool node_map_initialized = false;
     771                 :     110920 :   gcov_type threshold;
     772                 :            : 
     773                 :     110920 :   if (dump_file)
     774                 :         28 :     dump_histogram (dump_file, histogram);
     775                 :     117738 :   for (i = 0; i < (int)histogram.length (); i++)
     776                 :            :     {
     777                 :       2393 :       overall_time += histogram[i]->count * histogram[i]->time;
     778                 :       2393 :       overall_size += histogram[i]->size;
     779                 :            :     }
     780                 :     110920 :   threshold = 0;
     781                 :     110920 :   if (overall_time)
     782                 :            :     {
     783                 :         88 :       gcc_assert (overall_size);
     784                 :            : 
     785                 :         88 :       cutoff = (overall_time * param_hot_bb_count_ws_permille + 500) / 1000;
     786                 :        400 :       for (i = 0; cumulated < cutoff; i++)
     787                 :            :         {
     788                 :        312 :           cumulated += histogram[i]->count * histogram[i]->time;
     789                 :        312 :           threshold = histogram[i]->count;
     790                 :            :         }
     791                 :         88 :       if (!threshold)
     792                 :          0 :         threshold = 1;
     793                 :         88 :       if (dump_file)
     794                 :            :         {
     795                 :            :           gcov_type cumulated_time = 0, cumulated_size = 0;
     796                 :            : 
     797                 :         15 :           for (i = 0;
     798                 :         19 :                i < (int)histogram.length () && histogram[i]->count >= threshold;
     799                 :            :                i++)
     800                 :            :             {
     801                 :         15 :               cumulated_time += histogram[i]->count * histogram[i]->time;
     802                 :         15 :               cumulated_size += histogram[i]->size;
     803                 :            :             }
     804                 :          4 :           fprintf (dump_file, "Determined min count: %" PRId64
     805                 :            :                    " Time:%3.2f%% Size:%3.2f%%\n", 
     806                 :            :                    (int64_t)threshold,
     807                 :          4 :                    cumulated_time * 100.0 / overall_time,
     808                 :          4 :                    cumulated_size * 100.0 / overall_size);
     809                 :            :         }
     810                 :            : 
     811                 :         88 :       if (in_lto_p)
     812                 :            :         {
     813                 :          4 :           if (dump_file)
     814                 :          2 :             fprintf (dump_file, "Setting hotness threshold in LTO mode.\n");
     815                 :          4 :           set_hot_bb_threshold (threshold);
     816                 :            :         }
     817                 :            :     }
     818                 :     110920 :   histogram.release ();
     819                 :     110920 :   histogram_pool.release ();
     820                 :            : 
     821                 :            :   /* Produce speculative calls: we saved common target from profiling into
     822                 :            :      e->target_id.  Now, at link time, we can look up corresponding
     823                 :            :      function node and produce speculative call.  */
     824                 :            : 
     825                 :     110920 :   gcc_checking_assert (call_sums);
     826                 :            : 
     827                 :     110920 :   if (dump_file)
     828                 :            :     {
     829                 :         28 :       if (!node_map_initialized)
     830                 :         28 :         init_node_map (false);
     831                 :         28 :       node_map_initialized = true;
     832                 :            : 
     833                 :         28 :       ipa_profile_dump_all_summaries (dump_file);
     834                 :            :     }
     835                 :            : 
     836                 :    2083380 :   FOR_EACH_DEFINED_FUNCTION (n)
     837                 :            :     {
     838                 :     930770 :       bool update = false;
     839                 :            : 
     840                 :     930770 :       if (!opt_for_fn (n->decl, flag_ipa_profile))
     841                 :       8571 :         continue;
     842                 :            : 
     843                 :    1038820 :       for (e = n->indirect_calls; e; e = e->next_callee)
     844                 :            :         {
     845                 :     116618 :           if (n->count.initialized_p ())
     846                 :     116613 :             nindirect++;
     847                 :            : 
     848                 :     116618 :           speculative_call_summary *csum = call_sums->get_create (e);
     849                 :     116651 :           unsigned spec_count = csum->speculative_call_targets.length ();
     850                 :         33 :           if (spec_count)
     851                 :            :             {
     852                 :         33 :               if (!node_map_initialized)
     853                 :         15 :                 init_node_map (false);
     854                 :         33 :               node_map_initialized = true;
     855                 :         33 :               ncommon++;
     856                 :            : 
     857                 :         33 :               if (in_lto_p)
     858                 :            :                 {
     859                 :          3 :                   if (dump_file)
     860                 :            :                     {
     861                 :          2 :                       fprintf (dump_file,
     862                 :            :                                "Updating hotness threshold in LTO mode.\n");
     863                 :          2 :                       fprintf (dump_file, "Updated min count: %" PRId64 "\n",
     864                 :          2 :                                (int64_t) threshold / spec_count);
     865                 :            :                     }
     866                 :          3 :                   set_hot_bb_threshold (threshold / spec_count);
     867                 :            :                 }
     868                 :            : 
     869                 :         33 :               unsigned speculative_id = 0;
     870                 :         33 :               profile_count orig = e->count;
     871                 :         70 :               for (unsigned i = 0; i < spec_count; i++)
     872                 :            :                 {
     873                 :         37 :                   speculative_call_target item
     874                 :         37 :                     = csum->speculative_call_targets[i];
     875                 :         37 :                   n2 = find_func_by_profile_id (item.target_id);
     876                 :         37 :                   if (n2)
     877                 :            :                     {
     878                 :         36 :                       if (dump_file)
     879                 :            :                         {
     880                 :          7 :                           fprintf (dump_file,
     881                 :            :                                    "Indirect call -> direct call from"
     882                 :            :                                    " other module %s => %s, prob %3.2f\n",
     883                 :            :                                    n->dump_name (),
     884                 :            :                                    n2->dump_name (),
     885                 :            :                                    item.target_probability
     886                 :          7 :                                      / (float) REG_BR_PROB_BASE);
     887                 :            :                         }
     888                 :         36 :                       if (item.target_probability
     889                 :            :                           < REG_BR_PROB_BASE / GCOV_TOPN_VALUES / 2)
     890                 :            :                         {
     891                 :          0 :                           nuseless++;
     892                 :          0 :                           if (dump_file)
     893                 :          0 :                             fprintf (dump_file,
     894                 :            :                                      "Not speculating: "
     895                 :            :                                      "probability is too low.\n");
     896                 :            :                         }
     897                 :         36 :                       else if (!e->maybe_hot_p ())
     898                 :            :                         {
     899                 :          6 :                           nuseless++;
     900                 :          6 :                           if (dump_file)
     901                 :          0 :                             fprintf (dump_file,
     902                 :            :                                      "Not speculating: call is cold.\n");
     903                 :            :                         }
     904                 :         30 :                       else if (n2->get_availability () <= AVAIL_INTERPOSABLE
     905                 :         30 :                                && n2->can_be_discarded_p ())
     906                 :            :                         {
     907                 :          0 :                           nuseless++;
     908                 :          0 :                           if (dump_file)
     909                 :          0 :                             fprintf (dump_file,
     910                 :            :                                      "Not speculating: target is overwritable "
     911                 :            :                                      "and can be discarded.\n");
     912                 :            :                         }
     913                 :         30 :                       else if (!check_argument_count (n2, e))
     914                 :            :                         {
     915                 :          0 :                           nmismatch++;
     916                 :          0 :                           if (dump_file)
     917                 :          0 :                             fprintf (dump_file,
     918                 :            :                                      "Not speculating: "
     919                 :            :                                      "parameter count mismatch\n");
     920                 :            :                         }
     921                 :         30 :                       else if (e->indirect_info->polymorphic
     922                 :          7 :                                && !opt_for_fn (n->decl, flag_devirtualize)
     923                 :         34 :                                && !possible_polymorphic_call_target_p (e, n2))
     924                 :            :                         {
     925                 :          0 :                           nimpossible++;
     926                 :          0 :                           if (dump_file)
     927                 :          0 :                             fprintf (dump_file,
     928                 :            :                                      "Not speculating: "
     929                 :            :                                      "function is not in the polymorphic "
     930                 :            :                                      "call target list\n");
     931                 :            :                         }
     932                 :            :                       else
     933                 :            :                         {
     934                 :            :                           /* Target may be overwritable, but profile says that
     935                 :            :                              control flow goes to this particular implementation
     936                 :            :                              of N2.  Speculate on the local alias to allow
     937                 :            :                              inlining.  */
     938                 :         30 :                           if (!n2->can_be_discarded_p ())
     939                 :            :                             {
     940                 :         27 :                               cgraph_node *alias;
     941                 :         27 :                               alias = dyn_cast<cgraph_node *>
     942                 :         27 :                                    (n2->noninterposable_alias ());
     943                 :         27 :                               if (alias)
     944                 :         27 :                                 n2 = alias;
     945                 :            :                             }
     946                 :         30 :                           nconverted++;
     947                 :         30 :                           profile_probability prob
     948                 :            :                                  = profile_probability::from_reg_br_prob_base
     949                 :         30 :                                         (item.target_probability).adjusted ();
     950                 :         30 :                           e->make_speculative (n2,
     951                 :            :                                                orig.apply_probability (prob),
     952                 :            :                                                speculative_id);
     953                 :         30 :                           update = true;
     954                 :         30 :                           speculative_id++;
     955                 :            :                         }
     956                 :            :                     }
     957                 :            :                   else
     958                 :            :                     {
     959                 :          1 :                       if (dump_file)
     960                 :          0 :                         fprintf (dump_file,
     961                 :            :                                  "Function with profile-id %i not found.\n",
     962                 :            :                                  item.target_id);
     963                 :          1 :                       nunknown++;
     964                 :            :                     }
     965                 :            :                 }
     966                 :            :             }
     967                 :            :         }
     968                 :     922199 :       if (update)
     969                 :         25 :         ipa_update_overall_fn_summary (n);
     970                 :            :     }
     971                 :     110920 :   if (node_map_initialized)
     972                 :         43 :     del_node_map ();
     973                 :     110920 :   if (dump_file && nindirect)
     974                 :         26 :     fprintf (dump_file,
     975                 :            :              "%i indirect calls trained.\n"
     976                 :            :              "%i (%3.2f%%) have common target.\n"
     977                 :            :              "%i (%3.2f%%) targets was not found.\n"
     978                 :            :              "%i (%3.2f%%) targets had parameter count mismatch.\n"
     979                 :            :              "%i (%3.2f%%) targets was not in polymorphic call target list.\n"
     980                 :            :              "%i (%3.2f%%) speculations seems useless.\n"
     981                 :            :              "%i (%3.2f%%) speculations produced.\n",
     982                 :            :              nindirect,
     983                 :         26 :              ncommon, ncommon * 100.0 / nindirect,
     984                 :         26 :              nunknown, nunknown * 100.0 / nindirect,
     985                 :         26 :              nmismatch, nmismatch * 100.0 / nindirect,
     986                 :         26 :              nimpossible, nimpossible * 100.0 / nindirect,
     987                 :         26 :              nuseless, nuseless * 100.0 / nindirect,
     988                 :         26 :              nconverted, nconverted * 100.0 / nindirect);
     989                 :            : 
     990                 :     110920 :   order = XCNEWVEC (struct cgraph_node *, symtab->cgraph_count);
     991                 :     110920 :   order_pos = ipa_reverse_postorder (order);
     992                 :    2135270 :   for (i = order_pos - 1; i >= 0; i--)
     993                 :            :     {
     994                 :    2024350 :       if (order[i]->local
     995                 :     119016 :           && opt_for_fn (order[i]->decl, flag_ipa_profile)
     996                 :    2137500 :           && ipa_propagate_frequency (order[i]))
     997                 :            :         {
     998                 :     251537 :           for (e = order[i]->callees; e; e = e->next_callee)
     999                 :     227109 :             if (e->callee->local && !e->callee->aux)
    1000                 :            :               {
    1001                 :      15408 :                 something_changed = true;
    1002                 :      15408 :                 e->callee->aux = (void *)1;
    1003                 :            :               }
    1004                 :            :         }
    1005                 :    2024350 :       order[i]->aux = NULL;
    1006                 :            :     }
    1007                 :            : 
    1008                 :     118168 :   while (something_changed)
    1009                 :            :     {
    1010                 :            :       something_changed = false;
    1011                 :      99161 :       for (i = order_pos - 1; i >= 0; i--)
    1012                 :            :         {
    1013                 :      91913 :           if (order[i]->aux
    1014                 :      20792 :               && opt_for_fn (order[i]->decl, flag_ipa_profile)
    1015                 :     112705 :               && ipa_propagate_frequency (order[i]))
    1016                 :            :             {
    1017                 :      68200 :               for (e = order[i]->callees; e; e = e->next_callee)
    1018                 :      48679 :                 if (e->callee->local && !e->callee->aux)
    1019                 :            :                   {
    1020                 :       5384 :                     something_changed = true;
    1021                 :       5384 :                     e->callee->aux = (void *)1;
    1022                 :            :                   }
    1023                 :            :             }
    1024                 :      91913 :           order[i]->aux = NULL;
    1025                 :            :         }
    1026                 :            :     }
    1027                 :     110920 :   free (order);
    1028                 :            : 
    1029                 :     110920 :   if (dump_file && (dump_flags & TDF_DETAILS))
    1030                 :          0 :     symtab->dump (dump_file);
    1031                 :            : 
    1032                 :     110920 :   delete call_sums;
    1033                 :     110920 :   call_sums = NULL;
    1034                 :            : 
    1035                 :     110920 :   return 0;
    1036                 :            : }
    1037                 :            : 
    1038                 :            : namespace {
    1039                 :            : 
    1040                 :            : const pass_data pass_data_ipa_profile =
    1041                 :            : {
    1042                 :            :   IPA_PASS, /* type */
    1043                 :            :   "profile_estimate", /* name */
    1044                 :            :   OPTGROUP_NONE, /* optinfo_flags */
    1045                 :            :   TV_IPA_PROFILE, /* tv_id */
    1046                 :            :   0, /* properties_required */
    1047                 :            :   0, /* properties_provided */
    1048                 :            :   0, /* properties_destroyed */
    1049                 :            :   0, /* todo_flags_start */
    1050                 :            :   0, /* todo_flags_finish */
    1051                 :            : };
    1052                 :            : 
    1053                 :            : class pass_ipa_profile : public ipa_opt_pass_d
    1054                 :            : {
    1055                 :            : public:
    1056                 :     200773 :   pass_ipa_profile (gcc::context *ctxt)
    1057                 :            :     : ipa_opt_pass_d (pass_data_ipa_profile, ctxt,
    1058                 :            :                       ipa_profile_generate_summary, /* generate_summary */
    1059                 :            :                       ipa_profile_write_summary, /* write_summary */
    1060                 :            :                       ipa_profile_read_summary, /* read_summary */
    1061                 :            :                       NULL, /* write_optimization_summary */
    1062                 :            :                       NULL, /* read_optimization_summary */
    1063                 :            :                       NULL, /* stmt_fixup */
    1064                 :            :                       0, /* function_transform_todo_flags_start */
    1065                 :            :                       NULL, /* function_transform */
    1066                 :     401546 :                       NULL) /* variable_transform */
    1067                 :            :   {}
    1068                 :            : 
    1069                 :            :   /* opt_pass methods: */
    1070                 :     432166 :   virtual bool gate (function *) { return flag_ipa_profile || in_lto_p; }
    1071                 :     110920 :   virtual unsigned int execute (function *) { return ipa_profile (); }
    1072                 :            : 
    1073                 :            : }; // class pass_ipa_profile
    1074                 :            : 
    1075                 :            : } // anon namespace
    1076                 :            : 
    1077                 :            : ipa_opt_pass_d *
    1078                 :     200773 : make_pass_ipa_profile (gcc::context *ctxt)
    1079                 :            : {
    1080                 :     200773 :   return new pass_ipa_profile (ctxt);
    1081                 :            : }

Generated by: LCOV version 1.0

LCOV profile is generated on x86_64 machine using following configure options: configure --disable-bootstrap --enable-coverage=opt --enable-languages=c,c++,fortran,go,jit,lto --enable-host-shared. GCC test suite is run with the built compiler.