SectorNetwork/multiple_opt.jl at main · fholstege/SectorNetwork · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
using CSV
using DataFrames
using DataFramesMeta
using LinearAlgebra
using LightGraphs
using BlackBoxOptim
using Statistics
using Plots

# in 2019, banking is ranked 1
# question to answer: what to do to make banking increase one rank

## load data
data_path = joinpath(@__DIR__, "Data", "Matrices", "2016_nominal.csv")
df = CSV.read(data_path, DataFrame)
@select!(df, $(Not("Column1")))


# save column / row names in order
col_names = names(df)

# get column and row index of banking
const bank_idx = findall(col_names .== "Banking")[1]

## define helper functions

function normalize_rows_matrix(A)
    rowSums = sum(A, dims=2)
    normalized_matrix = A ./rowSums
    replace!(normalized_matrix, NaN=>0)
    return normalized_matrix
end

function normalize_rows_df(df)
    rowSums = sum.(eachrow(df))
    normalized_df = df ./rowSums

    replace_nan!(v::AbstractVector) = map!(x -> isnan(x) ? zero(x) : x, v, v)

    df_normalized_noNaN = ifelse.(isnan.(normalized_df), 0, normalized_df)
    return df_normalized_noNaN
end


function calc_eigenvec_centrality(A, type_centrality)

    if type_centrality == "left"
        A = transpose(A)
    end
    K = size(A, 1)
    k = 1
    eigen_result = eigen(A)
    eigenvectors = eigen_result.vectors[:,K-k+1:K]
    eigenvectors_abs = abs.(eigenvectors)

    return convert(Vector{Float64}, vec(eigenvectors_abs))
end


function get_distance_to_max_v(vs)
    max_v = maximum(vs)
    return max_v .- vs
end

function get_sector_ranked_nth(vs, n)
    return sortperm(vs, rev=true)[n]
end

function construct_A(A, x; opt = "all")
    if opt == "all"
        if length(x) != (80+79)
            println("x dimension incorrect")
        end
        A[bank_idx,:] = x[1:80]
        A[1:end .!= bank_idx, bank_idx] = x[81:end]
    elseif opt == "inputs"
        if length(x) != 80
            println("x dimension incorrect")
        end
        A[bank_idx,:] = x
    end
    return A
end

# find sector idx ranked one higher than banking
function find_next_rank_idx(vs)
    for i in 1:length(vs)
        rank_idx = get_sector_ranked_nth(vs, i)
        if rank_idx == bank_idx
            return get_sector_ranked_nth(vs, i-1)
        end
    end
end

# function to initialize all objects for optimization
function initialize_objects(df, budget, bank_idx, normalize = true)
    A = Matrix(df);

    if normalize
        A_norm = normalize_rows_matrix(A)
        vs_old = calc_eigenvec_centrality(A_norm, "right");
    else
        vs_old = calc_eigenvec_centrality(A, "right")
    end

    bank_rank = get_bank_rank(vs_old, bank_idx);
    println("bank rank = $bank_rank")

    return A, vs_old, bank_rank, budget
end

# find rank idx based on banking rank
function get_bank_rank(vs, bank_idx)
    for i in 1:length(vs)
        rank_idx = get_sector_ranked_nth(vs, i)
        if rank_idx == bank_idx
            return i
        end
    end
end

# find vs of the sector ranked above bank_rank
function get_v_of_next_rank(vs, bank_rank)
    return vs[get_sector_ranked_nth(vs, bank_rank-1)]
end

# check if budget constraint hold after having obtained results
function check_budget_constraint(results, budget)

    # compute total costs of proposed solution
    total_costs = sum(best_candidate(results))

    # output
    if total_costs > budget
        println("budget constraint violated\n total costs =  $total_costs\n budget = $budget")

    else
        println("budget constraint holds\n total costs =  $total_costs\n budget = $budget")
    end
end

## optimize naive objective function with budget constraint

function naive_objective_w_budget(x, bank_idx, bank_rank, vs_old, A, budget, normalize, save_x, list_obj_values, list_constraint_values, λb = 0.2)

    push!(save_x, x)
    # construct A based on xs
    A_new = construct_A(deepcopy(A), x; opt = "inputs")

    if normalize
        A_new = normalize_rows_matrix(A_new)
    end
    # get new eigenvector centralities
    vs_new = calc_eigenvec_centrality(A_new, "right")

    # get eigenvector centrality of the sector in next rank
    v_next_rank = get_v_of_next_rank(vs_new, bank_rank)

    # define objective function
    obj = (1-λb) * (1e4 * max(0, (v_next_rank - vs_new[bank_idx])))
    budget_constraint = λb * max(0, sum(x) - budget)^2

    push!(list_obj_values, obj)
    push!(list_constraint_values, budget_constraint)


    # hand over parameters
    for i in 1:length(vs_old)
        vs_old[i] = vs_new[i]
    end

    return obj + budget_constraint
end

function repeated_spsa(n_runs, objective_func, bank_idx, bank_rank, vs_old, A, budget, λb,
    SearchRange = (0.0, 5000.0),
    NumDimensions=80 ,
    MaxSteps = 30000 )

    results = Array{Any}(undef,NumDimensions , n_runs)
    fill!(results,NaN)

    Threads.@threads for i = 1:n_runs
        result = bboptimize( x -> objective_func(x, bank_idx, bank_rank, vs_old, A, budget, λb);
                SearchRange = SearchRange,
                NumDimensions = NumDimensions,
                MaxSteps = MaxSteps,
                Method = :simultaneous_perturbation_stochastic_approximation,NThreads=Threads.nthreads()-2);

        result_param = best_candidate(result)
        results[:,i] = result_param
    end

    return results
end


# init parameters and objects
previous_total_x = sum(df[bank_idx, :]);

# now with normalize = True; A = unnormalized, vs_old = from normalized matrix
A, vs_old, bank_rank, budget = initialize_objects(df, previous_total_x, bank_idx);

# save vs_old for evaluation of results
vs_original = deepcopy(vs_old);

# put the constraints in place
constraint = (0.0,5000.0)
constraints = [constraint for i in 1:80]

list_obj_values = []
list_constraint_values = []
save_x = []

x_0 = A[bank_idx, :]
# we have to pick year data where banking is not highly ranked
# otherwise problem if banking is already rank 1, or if it has the same eigenvector centrality as rank 1
res_naive = bboptimize(x -> naive_objective_w_budget(x, bank_idx, bank_rank, vs_old, A, budget,true,  list_obj_values,list_constraint_values ,save_x,0.5); # put lambda_b = 0.5
                x0 = x_0,
                SearchRange = constraints,
                NumDimensions = 80,
                MaxSteps = 3000,
                Method = :simultaneous_perturbation_stochastic_approximation,NThreads=Threads.nthreads()-2);

best_candidate(res_naive)
list_constraint_values


x = 1:length(list_obj_values)
y = list_obj_values; # These are the plotting data
plot(x, y)


# check results
check_budget_constraint(res_naive, budget)

hcat(best_candidate(res_naive), A[bank_idx,:], col_names)

DataFrame(original = A_normalized[bank_idx,:],
          result = best_candidate(res_naive),
          sector = col_names)


# get top 10 sectors in terms of eigenvector centrality
A_result = construct_A(copy(A), best_candidate(res_naive), opt = "inputs");

vs_result = calc_eigenvec_centrality(normalize_rows_matrix(A_result), "right");


vs_original_names = hcat(col_names, vs_original)
vs_result_names = hcat(col_names, vs_result)

vs_original_names[bank_idx-1:bank_idx+1,:]
vs_result_names[bank_idx-1:bank_idx+1,:]


top10_original = [get_sector_ranked_nth(vs_original, i) for i in 75:80]
top10_result = [get_sector_ranked_nth(vs_result, i) for i in 75:80]


top10_original = [vs_original_names[get_sector_ranked_nth(vs_original, i),1:2] for i in 75:80]
top10_result = [vs_result_names[get_sector_ranked_nth(vs_result, i),1:2] for i in 75:80]

hcat(top10_original, top10_result)


###############

results = repeated_spsa(100,  naive_objective_w_budget, bank_idx, bank_rank, vs_old, A, budget, 0.2)

average_row_values = mean(results, dims= 2)
sd_row_values = std(results, dims = 2)

CI_lower_row_values = average_row_values - (1.96* sd_row_values)
CI_upper_row_values = average_row_values + (1.96* sd_row_values)

hcat(average_row_values,sd_row_values,CI_lower_row_values, CI_upper_row_values  )


####

x = best_candidate(res_naive)
 # construct A based on xs
A_new = construct_A(deepcopy(A), x; opt = "inputs")


A_new = normalize_rows_matrix(A_new)
 # get new eigenvector centralities
vs_new = calc_eigenvec_centrality(A_new, "right")
vs_new[bank_idx]
 # get eigenvector centrality of the sector in next rank
 v_next_rank = get_v_of_next_rank(vs_new, bank_rank)

 # define objective function
 λb=0.5
 obj = (1-λb) * (1e4 * max(0, (v_next_rank - vs_new[bank_idx])))
 budget_constraint = λb * max(0, sum(x) - budget)^2
 obj